Antes de empezar a usar la búsqueda vectorial, debe elegir un modelo de inserción, preparar sus datos y decidir qué tipo de endpoint va a usar. En esta página se ofrece información sobre cómo hacerlo.
Prepara tus inserciones
Para usar Vector Search, debes tener listas tus inserciones. Si ya tienes tus inserciones, ve a Elegir un endpoint.
Para crear tus inserciones, sigue estos pasos:
Elige un modelo de inserción: hay muchos modelos de inserción externos disponibles que ofrecen diferentes funciones.
Búsqueda de vectores admite incrustaciones densas, incrustaciones dispersas y búsqueda híbrida. La búsqueda híbrida usa incrustaciones densas y dispersas según el peso que especifiques para esos tipos de incrustaciones.
En función de tu caso práctico, elige uno de los siguientes tipos de modelo:
Listo para usar: si quieres que el texto coincida semánticamente con otro texto o con imágenes en función de la relevancia del texto o de la imagen. Este es un caso práctico estándar, por lo que no es necesario entrenar ni ajustar el modelo. IA generativa en Vertex AI es una opción recomendada para este caso práctico. La IA generativa en Vertex AI usa modelos de inserción densa.
Modelo personalizado para incrustaciones: si quieres hacer coincidencias basadas en tus propios datos o en un caso práctico específico.
Prepara tus datos: limpia y preprocesa tus datos para asegurarte de que tengan un formato que pueda usar el modelo de inserciones.
Entrena el modelo de inserciones si usas un modelo personalizado: si decides usar un modelo de inserciones personalizado (ajuste), debes entrenarlo con tus datos. Este proceso puede llevar mucho tiempo, en función del tamaño y la complejidad de los datos. Si usas un modelo preentrenado de Model Garden, puedes saltarte este paso.
Generar inserciones: una vez que se haya entrenado el modelo, úsalo para generar inserciones de tus datos.
Elige un endpoint
Una vez que hayas creado el índice, lo desplegarás en un endpoint. Para obtener más información, consulta los artículos Implementar y gestionar endpoints de índice públicos e Implementar y gestionar endpoints de índice en una red de VPC. Es útil decidir qué tipo de endpoint necesitas antes de crear el índice.
Puedes implementar tu índice de consultas en uno de los siguientes elementos:
Endpoint público: si implementas en un endpoint público, no tienes que configurar tu red. Las redes públicas tienen una latencia ligeramente superior, pero son más rápidas de configurar y más fáciles de mantener.
Endpoint privado: si quieres usar una VPC, primero debes configurar la red. Búsqueda vectorial admite dos tipos de redes privadas.
Conexión de emparejamiento entre redes de VPC para reducir la latencia de la red.
Private Service Connect para el consumo privado de servicios en redes de VPC que pertenecen a diferentes grupos, equipos, proyectos u organizaciones.
Siguientes pasos
Una vez que hayas generado tus inserciones y decidido dónde implementar tu índice, el siguiente paso es configurarlo.
- Consulte cómo configurar el formato y la estructura de los datos de entrada.
- Consulta cómo crear un índice de búsqueda vectorial con tutoriales de cuaderno.
- Consulta cómo gestionar los índices.