Buscadores Google personalizados
Enero 3, 2007, 11:30 am
Guardado en: HTML / JavaScript, SEO, Usabilidad

Por Patricia Campuzano

El pasado mes de octubre Google amplió su plataforma con Custom Search EngineBásicamente permite crear buscadores personalizados para buscar contenidos en nuestro sitio web o en otros que especifiquemos al crear el buscador.

Tan rápido y sencillo como dar nombre al buscador, una descripción, palabras clave que describan los contenidos que el buscador se encargará de localizar (hojas de estilos css, dhtml, javascript, etc…), idioma y sitios web donde realizará la búsqueda.

Como es habitual, para utilizar el servicio (totalmente gratuito) es necesario tener una cuenta gmail. Una vez creado, puedes incluir el buscador en tu sitio web copiando el código correspondiente.



Zeitgeist de Google
Diciembre 16, 2006, 9:29 pm
Guardado en: SEO

¿Cuáles son las palabras más buscadas en Google por los internautas españoles? La nueva herramienta de Google, Zeitgeist, ofrece las 15 palabras más buscadas por los españoles en la siguiente dirección: http://www.google.com/press/zeitgeist.html



Googlebot, rastreando sitios web
Diciembre 16, 2006, 9:25 pm
Guardado en: SEO

Googlebot es el robot que utiliza Google para ‘rastrear’ los sitios de Internet. No solamente indexa páginas web (HTML), sino que también extrae información de ficheros PDF, PS, XLS, DOC y algunos otros más.

La frecuencia con la que Googlebot accede a un sitio web depende del PageRank de éste. Contra mayor sea este valor, el robot accederá más asiduamente a sus páginas.

Por ejemplo, podemos comprobar que los sitios con PR10 (el valor más alto), como yahoo.com o usatoday.com, han sido ‘rastreados’ por Googlebot ayer o incluso hoy mismo, mientras que otros han sido accedidos hace varias semanas. Esto se puede comprobar accediendo al ‘cache’ de esta página.

Para comprobar si Googlebot ha accedido a nuestro sitio web, deberemos echar un vistazo a los logs de nuestro servidor. En ellos, deberemos observar si hay registros de accesos en los que aparezca ‘googlebot’.

Googlebot intentará acceder, como hacen la mayoría de los robots de los motores de búsqueda, al fichero ‘robots.txt’. En este archivo se deberán indicar las zonas de nuestro sitio web donde no queremos que entre ni Googlebot ni el resto de los buscadores. Para conocer más sobre ‘robots.txt’, existe un magnígico recurso: www.robotstxt.org.

Una vez que Googlebot haya ‘rastreado’ nuestra página, seguirá los enlaces que en ella encuentre (los HREF y los SRC).

Por lo tanto, si quieres que Googlebot indexe tu página web, solamente es necesario que algún otro sitio tenga un hiperenlace al tuyo. Si no es así, siempre puedes añadir directamente tu URL.

Además de este robot GoogleBot, existe otro, llamado FreshBot que ‘rastrea’ con mayor frecuencia los sitios webs con las noticias ‘más frescas’.

Fuente: http://google.dirson.com/googlebot.php



Qué información omite Google
Diciembre 16, 2006, 9:08 pm
Guardado en: SEO

Google omite los contenidos que estén en los siguientes elementos:

JavaScript
DHTML
Flash
Frames
Session IDs
Applets de Java
Imágenes: no insertes textos dentro de ellas.

Fuente: google.dirson.com



Evitar que Google rastree un directorio web
Diciembre 16, 2006, 9:07 pm
Guardado en: SEO

Para evitar que Google rastree un directorio de tu sitio web, puedes crear un fichero llamado ‘robots.txt’, y dejarlo en el directorio raíz (de la forma ‘http://www.midominio.com/robots.txt’). Este fichero debería contener:

User-agent: googlebotDisallow: /mi_directorio/ Tienes más información sobre el fichero ‘robots.txt’ en robotstxt.org.

Otra opción es escribir dentro de cada página web que quieres excluir de Google, y en la zona ‘HEAD’, el siguiente código:

META NAME=”googlebot” CONTENT=”noarchive,nofollow”

Fuente: Webestilo.com



Páginas ‘doorway’
Diciembre 16, 2006, 9:06 pm
Guardado en: SEO

Este tipo de páginas, también llamadas “gateway pages”, se hacen exclusivamente para “atraer” a los buscadores. Uno de los factores que hace posible que una web obtenga buenos resultados en google es, entre otras cosas, las palabras clave que tenga en su código. Esta páginas las construyen abusando de las palabras clave insertándolas en el TITLE, los H1, a href, textos, etc… El usuario no llega siquiera a ver esta página “trampa”, puesto que al entrar en ella se le redirige (normalmente por medio de un javascript) a otra web diseñada para los usuarios.

Google no reconoce el Javascript y almacena sin más la página “doorway” como otra cualquiera. Importante: esta práctica está penalizada por Google, pudiendo inlcuso eliminar el sitio por completo.



Consejos para indexar una página web en los buscadores
Noviembre 4, 2006, 2:39 pm
Guardado en: SEO

Por Patricia Campuzano 

Desde mi punto de vista como diseñadora de sitios web, una página está “bien hecha” no sólo cuando su diseño es atractivo y funcional, sino además cuando tiene por detrás un código impecable (al margen de que sus contenidos me puedan o no parecer interesantes). Ambos aspectos de la página son importantes y tenemos que dedicarles el mismo trabajo y esfuerzo para conseguir resultados. El diseño está orientado a la audiencia del site mientras que el código, al contenido y objetivos de la página.

Dejando a un lado cuestiones de diseño, me interesa un post centrado exclusivamente en optimizar el código de una página web para que sea indexada, en el mejor de los casos, por los principales buscadores. Hace tiempo escribí un post sobre cómo elevar el pagerank de tu sitio web con recomendaciones de Google Dirson, pero hay otros consejos a tener en cuenta sobre etiquetas html que habrá que añadir al código para ayudar a que nuestro sitio web salga del pozo sin fondo en el que se está convirtiendo Internet.

Empezamos entonces con algunos consejos para optimizar el código de una páigna web:

1.- El primer consejo si quieres que tu sitio web sea indexado es que te olvides de flash, y te lo dice una amante de los sites animados. Google (y cualquier buscador) ignora por completo toda la información que contiene un SWF. Esto no significa que no podamos incluir archivos flash en las páginas, pero ha de ser de forma moderada y para casos muy concretos (un banner publicitario, una galería de imágenes, archivos multimedia, etc…) pero nunca para incluir los contenidos relevantes de la página. Resumiendo, la página web ha der ser html y si además maquetamos los contenidos a través de hojas de estilo CSS magnífico, eso evitará sobrecargar el código con etiquetas innecesarias.

2.- El título de la página es muy importante. No nos conformemos con poner sólo el nombre de la compañía, añadamos una breve descripción sobre los servicios, productos o contenidos que ofrece al usuario. Cada página del site debe tener su título correspondiente que haga referencia al contenido de la misma.

3.- Etiquetas <meta> que ofrecerán información a los buscadores sobre los contenidos del sitio web. Debemos añadir varias después del titulo <title> de la página. Por ejemplo, las etiquetas <meta> para este blog serían las siguientes:

<META content=”Usabilidad web - Tutoriales sobre diseño, usabilidad y animacion web” name=title>
<META content=”Usabilidad web - Tutoriales sobre diseño, usabilidad y animacion web” name=DC.Title>
<META http-equiv=title content=”Flash, ActionScript, Hojas de estilo CSS, HTML, DHTML, Newsletters, SEO optimización en buscadores, usabilidad web”>
<META content=”tutoriales, usabilidad, animacion, paginas web, flash, ActionScript, Hojas de estilo CSS, HTML, DHTML, Newsletters, SEO optimización en buscadores, usabilidad web” name=keywords>
<META content=”Usabilidad web - Tutoriales sobre diseño, usabilidad y animacion web” name=description>
<META content=”Usabilidad web - Tutoriales sobre diseño, usabilidad y animacion web por Patricia Campuzano” name=author>
<META http-equiv=keywords content=”tutoriales, usabilidad, animacion, paginas web, flash, ActionScript, Hojas de estilo CSS, HTML, DHTML, Newsletters, SEO optimización en buscadores, usabilidad web”>
<META http-equiv=description content=”Blog personal de Patricia Campuzano con tutoriales sobre diseño, usabilidad y animación web”>
<META http-equiv=DC.Description content=”Blog personal de Patricia Campuzano con tutoriales sobre diseño, usabilidad y animación web”>

4.- Texto, mucho texto. Lo que más le gusta a los buscadores son los textos, palabras relacionadas a la búsqueda que ha realizado el usuario (por eso desechábamos la opción SWF). Cuantas más veces aparezca en los textos de tu página la/s palabra/s que busca, más posibilidades habrá de que excoga tu página para ofrecer el link al usuario en los resultados de búsqueda.

5.- Todos los enlaces de texto deben llevar el atributo title con información sobre la página a la que lleva dicho enlace. Por ejemplo, tenemos un enlace para visitar un manual estupendo sobre las hojas de estilo, la forma correcta de ponerlo sería la siguiente:

<a href=”manual_hojasCSS.html” mce_href=”manual_hojasCSS.html” title=”Manual práctico sobre hojas de estilo CSS”>Manual sobre hojas de estilo CSS</a> 

Como puedes observar, tanto el title como el texto del enlace ofrecen información sobre la página a la que llevará dicho enlace. Esto les encanta a los buscadores…

6.- Todas las imágenes, incluídos iconos y pixels transparentes de maquetación, todas, deben llevar el atributo alt del mismo modo que veíamos en el caso anterior, bien con información sobre la imagen o, si la imagen es “invisible” para el usuario, con información sobre la página (idem a las etiquetas meta).

7.- Enlaces a todas las páginas del site. Es muy normal ver que casi todos los grandes portales tienen, a pie de página, un listado de todas las páginas que comprenden el sitio web y además, enlaces a otros sitios web de la misma compañía. Esto está directamente relacionado con el PageRank, cuantos más enlaces haya a una página web en concreto, más importante será dicha página para un buscador (… ¿qué sucede en esa página que hay muchas enlazando a ella? vamos a ver…).

Hasta aqui los primeros consejos para mejorar el código html de una página en función de los buscadores. Si tienes alguna duda, deja un comentario!



Generar palabras clave para nuestro sitio web
Junio 14, 2006, 7:48 pm
Guardado en: SEO

por Patricia Campuzano  

Si no sabes qué palabras clave utilizar en tu página web, Google te ofrece ayuda a través de su herramienta KeywordSandbox que puedes consultar en la siguiente dirección: https://adwords.google.es/select/KeywordSandbox

MivaEspaña ofrece un servicio similar donde con sólo introducir la palabra clave por la que se desea pujar te muestra las búsquedas que dicha palabra ha recibido en los últimos 30 días y los términos adicionales relacionados que incluyen dicha palabra.

Otra página similar pero más "limitada", http://inventory.overture.com/d/searchinventory/suggestion/



No pierdas de vista el PageRank de tu sitio web
Junio 14, 2006, 7:39 pm
Guardado en: SEO

por Patricia Campuzano 

El PageRank es un valor numérico (de 0 a 10) que Google otorga a las páginas web para medir su importancia en Internet. Cuanto mayor es el valor del PageRank, más importante es el sitio web para Google. Es el objetivo a seguir si queremos que nuestro sitio web tenga éxito en internet, es decir, salir entre los primeros resultados de una búsqueda realizada en Google (el buscador preferido por la mayoría de los internautas).

Para conocer el valor del PageRank necesitas tener instalada la barra de herramientas Google (ToolBar Google).

Para obtener un PageRank elevado, es necesario que se cumplan varios factores:

- Tener un elevado número de visitas al día. Realmente no existe una fórmula para conseguir muchas visitas al día, pero si hay algo que ayuda a esta labor son los contenidos. Un sitio web con contenidos relevantes para el usuario y actualizados a diario será más propenso a recibir visitas que otro sitio web con poca frecuencia de actualización y contenidos flojos. Los mejores ejemplos son los periódicos digitales (www.libertaddigital.com, www.elpais.com, www.elmundo.es,&hellip ;) que deben recibir al día miles de visitantes únicos.

- Tener muchos enlaces externos a tu página web. Para Google, un enlace a tu sitio web es un "voto", y de más calidad si los enlaces vienen de páginas con un PageRank elevado. Si quieres conocer qué sitios web tienen un enlace a tu página web, realiza una búsqueda en Google de la siguiente manera: link:http://www.design-root.com/ donde http://www.design-root.com/ ha de ser la dirección de tu sitio web.

- Actualizar los contenidos regularmente. Ya lo decíamos al principio, un sitio web que no se actualiza está "muerto". El mejor momento para actualizar los contenidos es durante la GoogleDance, es decir, durante el periodo en que Google actualiza los PageRank de los sitios web modificando así los resultados de búsqueda. Este proceso de actualización suele ocurrir una vez al mes (aprox.) y dura 4 días. Si se deja mucho tiempo entre las actualizaciones del sitio web, se reduce la cantidad de páginas que serán incluídas en la próxima actualización.

Podemos conocer cuándo se realizarán estas actualizaciones (que duran aprox. 4 días) y en qué posición quedará nuestro sitio web consultando la tabla de fechas (ha hora es la de la costa Oeste de Estados Unidos, donde está situado Google Inc.) en GoogleDance.

Fuente: http://google.dirson.com/