Compartir a través de


Búsqueda semántica (SQL Server)

La búsqueda semántica estadística proporciona información detallada sobre los documentos no estructurados almacenados en bases de datos de SQL Server mediante la extracción e indexación de frases clave estadísticamente relevantes. A continuación, también usa estas frases clave para identificar e indexar documentos similares o relacionados.

Puede consultar estos índices semánticos mediante tres funciones de conjunto de filas Transact-SQL para recuperar los resultados como datos estructurados.

¿Qué puedo hacer con la búsqueda semántica?

La búsqueda semántica se basa en la característica de búsqueda de texto completo existente en SQL Server, pero permite nuevos escenarios que van más allá de las búsquedas de palabras clave. Aunque la búsqueda de texto completo le permite consultar las palabras de un documento, la búsqueda semántica le permite consultar el significado del documento. Entre las soluciones que ahora son posibles se incluyen la extracción automática de etiquetas, la detección de contenido relacionada y la navegación jerárquica en contenido similar. Por ejemplo, puede consultar el índice de frases clave para crear la taxonomía para una organización o para un corpus de documentos. O puede consultar el índice de similitud del documento para identificar currículums que se ajusten a una descripción de puesto.

En los ejemplos siguientes se muestran las funcionalidades de la búsqueda semántica.

Buscar las frases clave en un documento

La consulta siguiente obtiene las frases clave identificadas en el documento de ejemplo. Presenta los resultados en orden descendente por la puntuación que clasifica la importancia estadística de cada frase clave. Esta consulta llama a la función semantickeyphrasetable (Transact-SQL).

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS Title, keyphrase, score  
    FROM SEMANTICKEYPHRASETABLE(Documents, *, @DocID)  
    ORDER BY score DESC  
  

Buscar documentos similares o relacionados

La consulta siguiente obtiene los documentos identificados como similares o relacionados con el documento de ejemplo. Presenta los resultados en orden descendente por la puntuación que clasifica la similitud de los 2 documentos. Esta consulta llama a la función semanticsimilaritytable (Transact-SQL).

SET @Title = 'Sample Document.docx'  
  
SELECT @DocID = DocumentID  
    FROM Documents  
    WHERE DocumentTitle = @Title  
  
SELECT @Title AS SourceTitle, DocumentTitle AS MatchedTitle,  
        DocumentID, score  
    FROM SEMANTICSIMILARITYTABLE(Documents, *, @DocID)  
    INNER JOIN Documents ON DocumentID = matched_document_key  
    ORDER BY score DESC  
  

Buscar las frases clave que hacen que los documentos sean similares o relacionados

La consulta siguiente obtiene las frases clave que hacen que los dos documentos de ejemplo sean similares o relacionados entre sí. Presenta los resultados en orden descendente por la puntuación que clasifica el peso de cada frase clave. Esta consulta llama a la función semanticsimilaritydetailstable (Transact-SQL).

SET @SourceTitle = 'first.docx'  
SET @MatchedTitle = 'second.docx'  
  
SELECT @SourceDocID = DocumentID FROM Documents WHERE DocumentTitle = @SourceTitle  
SELECT @MatchedDocID = DocumentID FROM Documents WHERE DocumentTitle = @MatchedTitle  
  
SELECT @SourceTitle AS SourceTitle, @MatchedTitle AS MatchedTitle, keyphrase, score  
    FROM semanticsimilaritydetailstable(Documents, DocumentContent,  
        @SourceDocID, DocumentContent, @MatchedDocID)  
    ORDER BY score DESC  
  

Almacenar documentos en SQL Server

Para poder indexar documentos con búsqueda semántica, debe almacenar los documentos en una base de datos de SQL Server.

La característica FileTable de SQL Server 2014 convierte a los archivos y documentos no estructurados en ciudadanos de primera clase de la base de datos relacional. Como resultado, los desarrolladores de bases de datos pueden manipular documentos junto con datos estructurados en Transact-SQL operaciones basadas en conjuntos.

Para obtener más información sobre la característica FileTable, vea FileTables (SQL Server). Para obtener información sobre la característica FILESTREAM, que es otra opción para almacenar documentos en la base de datos, vea FILESTREAM (SQL Server).

Tareas relacionadas

Instalación y configuración de la búsqueda semántica
Describe los requisitos previos para la búsqueda semántica estadística y cómo instalarlos o comprobarlos.

Habilitar la búsqueda semántica en tablas y columnas
Describe cómo habilitar o deshabilitar la indexación semántica estadística en columnas seleccionadas que contienen documentos o texto.

Buscar frases clave en documentos con búsqueda semántica
Describe cómo buscar las frases clave en documentos o columnas de texto configuradas para la indexación semántica estadística.

Buscar documentos similares y relacionados con la búsqueda semántica
Describe cómo buscar documentos o valores de texto similares o relacionados e información sobre cómo son similares o relacionados, en columnas configuradas para la indexación semántica estadística.

Administración y supervisión de la búsqueda semántica
Describe el proceso de indexación semántica y las tareas relacionadas con la supervisión y administración de los índices.

Contenido relacionado

DDL de búsqueda semántica, funciones, procedimientos almacenados y vistas
Enumera las instrucciones Transact-SQL y los objetos de base de datos de SQL Server agregados o modificados para admitir la búsqueda semántica estadística.