La vectorisation a notamment pour objectif de rendre le texte non structuré plus exploitable par les machines. Les embeddings vectoriels y parviennent en codant la sémantique du texte sous forme de vecteurs numeric à haute dimensionalité, qui peuvent être utilisés par des algorithmes de recherche avancés (généralement un algorithme de plus proche voisin approximatif tel que Hierarchical Navigable Small World).
La recherche vectorielle est une méthode utilisée dans la recherche d'informations et l'apprentissage automatique pour trouver des éléments similaires sur la base de leurs représentations mathématiques en tant que vecteurs. Dans cette approche, chaque élément est représenté sous la forme d'un vecteur à dimensions élevées, chaque dimension correspondant à un élément ou à une caractéristique de l'élément. Les algorithmes de recherche vectorielle comparent ensuite ces vecteurs pour trouver des éléments similaires, par exemple s'ils présentent des caractéristiques similaires ou s'ils sont proches les uns des autres dans l'espace vectoriel. Pour en savoir plus, cliquez ici.
.png)
.jpg)

.png)
.jpg)

.png)
