Como es Google Bert a final de 2019

Este nuevo algoritmo maneja tareas como el reconocimiento de entidades, parte del etiquetado de voz, y preguntas-respuestas, así como otros procesos de lenguaje natural. Además, debido a que Google ha creado esta tecnología de código abierto, otros han creado variaciones del BERT.

BERT añade a las herramientas de consulta existentes y crea otra forma de que Google entienda el idioma. Dependiendo de la naturaleza de la consulta, Google tomará una o varias de las herramientas utilizadas para descifrar una búsqueda y proporcionará el resultado más relevante.

El BERT también tendrá un impacto en los fragmentos destacados. Los fragmentos destacados son un formato que proporciona a los usuarios una respuesta concisa a sus preguntas directamente en una página de resultados de búsqueda. Como tal, los usuarios no tienen que hacer clic en un resultado específico. Se extrae de una página web e incluye el título y la URL de la página.

Los fragmentos destacados proporcionan varios beneficios a los sitios que los utilizan de manera efectiva. Un fragmento destacado demuestra que Google eligió su página en lugar de otras como la más relevante para la consulta de un usuario. Permite que un sitio sea la respuesta rápida a una pregunta específica, superando así a la competencia en términos de visibilidad y ranking. Debido a que los fragmentos destacados proporcionan una ventaja de visibilidad, también pueden aumentar el tráfico a un sitio en particular hasta en un 30% segun indica un experto seo.

CÓMO BERT ENTENDERÁ MEJOR LAS BÚSQUEDAS
La investigación de Google ha demostrado que las búsquedas más largas y conversacionales que contienen preposiciones como «para» y «para» importan mucho para el significado.

El BERT tiene en cuenta el contexto de estas palabras en una consulta. Esto significa que ahora los usuarios pueden buscar de una manera más natural, sabiendo que los resultados serán más relevantes que nunca.

Google realizó extensas pruebas para asegurarse de que los cambios en el BERT son más útiles para los resultados de búsqueda relevantes.

Como parte de su anuncio de lanzamiento, Google citó ejemplos de su proceso de evaluación que demostraron la capacidad del BERT para comprender la intención de un usuario detrás de su búsqueda.

LA IMPORTANCIA DE LOS DATOS PREVIOS A LA FORMACIÓN

El procesamiento del lenguaje natural (PNL) depende de los datos de formación para ayudar a crear los mejores resultados de búsqueda posibles. Uno de los mayores desafíos es la escasez de datos de capacitación para completar mejor esta tarea. La mayoría de los conjuntos de datos de tareas específicas sólo contienen cantidades relativamente pequeñas de ejemplos de formación etiquetados por el ser humano. A veces esto puede variar desde unos pocos miles de ejemplos hasta unos pocos cientos de miles de muestras.

Los modelos modernos de PNL basados en el aprendizaje funcionan mejor cuando hay cantidades más sustanciales de datos. Los resultados mejoran cuando hay millones o incluso miles de millones de ejemplos de entrenamiento anotados.

Para ayudar a cerrar esta brecha y hacer que la PNL sea más relevante y útil, los investigadores han desarrollado varias técnicas que utilizan grandes cantidades de texto no comentado en la web. Esto se conoce como pre-entrenamiento. Los modelos pre-entrenados son entonces afinados en pequeñas tareas de PNL de datos que pueden resultar en mejoras sustanciales en la precisión de la búsqueda cuando se comparan con los conjuntos de datos que se generan desde cero.

Las representaciones pre-entrenadas pueden ser libres de contexto o contextuales. ¿Por qué es importante? Esto significa que las palabras pueden ser independientes o relacionadas entre sí en el contexto de una búsqueda.

Las representaciones contextuales pueden ser unidireccionales o bidireccionales. Los mejores resultados se obtienen cuando se emplean métodos bidireccionales.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Time limit is exhausted. Please reload the CAPTCHA.