#Données non structurées

0 Abonnés · 7 Publications

Les données non structurées (ou informations non structurées) sont des informations qui soit n'ont pas de modèle de données prédéfini, soit ne sont pas organisées d'une manière prédéfinie. Les informations non structurées sont généralement constituées de texte, mais peuvent également contenir des données telles que des dates, des chiffres et des faits.

Tout

Top

Par mise à jour

Article Sylvain Guilbaud · Avr 20 8m read

Recherche vectorielle avec Embedded Python dans InterSystems IRIS

La vectorisation a notamment pour objectif de rendre le texte non structuré plus exploitable par les machines. Les embeddings vectoriels y parviennent en codant la sémantique du texte sous forme de vecteurs numeric à haute dimensionalité, qui peuvent être utilisés par des algorithmes de recherche avancés (généralement un algorithme de plus proche voisin approximatif tel que Hierarchical Navigable Small World).

#InterSystems IRIS #Conseils et astuces #Données non structurées #Embedded Python #Tutoriel #Vector Search

1 0

1 14

Article Sylvain Guilbaud · Mars 22, 2024 5m read

Balisage des données dans IRIS à l'aide de Python intégré et de l'API OpenAI

L'invention et la vulgarisation des grands modèles de langage (tels que GPT-4 d'OpenAI) ont lancé une vague de solutions innovantes capables d'exploiter de grands volumes de données non structurées qui étaient peu pratiques, voire impossibles, à traiter manuellement jusqu'à récemment. Ces applications peuvent inclure la récupération de données (voir le cours ML301 de Don Woodlock pour une excellente introduction à Retrieval Augmented Generation), l'analyse des sentiments, et même des agents d'IA entièrement autonomes, pour n'en nommer que quelques-uns !

#InterSystems IRIS #Artificial Intelligence (AI) #Analytique #API #Données non structurées #Embedded Python #ObjectScript #Python

3 0

0 146

Article Pierre LaFay · Fév 28, 2024 5m read

Des informations sur les données non structurées à l'aide de la recherche de texte SQL

Qu'est-ce que les données non structurées ?

Les données non structurées sont des informations qui n'ont pas de modèle de données ou d'organisation prédéfinis. Contrairement aux données structurées que l'on trouve dans les bases de données avec des structures claires (par exemple, des tables et des champs), les données non structurées n'ont pas de schéma fixe. Ce type de données comprend le texte, les images, les vidéos, les fichiers audio, les messages sur les médias sociaux, les courriels, etc.

Pourquoi les données non structurées sont-elles importantes ?

#InterSystems IRIS #Artificial Intelligence (AI) #Bases de données #Données non structurées #iFind #SQL #Tutoriel

2 0

0 101

Article Iryna Mykhailova · Juil 19, 2022 9m read

Différents modèles de données dans InterSystems IRIS

Pour parler des différentes bases de données et des différents modèles de données qui existent, on doit premièrement comprendre ce qui est une base de données et comment les utiliser.

Une base de données est une collection organisée de données stockées et accessibles par voie électronique. Elle permet de stocker et de retrouver des données structurées, semi-structurées ou des données brutes souvent en rapport avec un thème ou une activité.

Au cœur de chaque base de données se trouve au moins un modèle utilisé pour décrire ses données. Et selon le modèle sur lequel elle est basée, elle peut avoir des caractéristiques un peu différentes et stocker différents types de données.

Pour inscrire, retrouver, modifier, trier, transformer ou imprimer les informations de la base de données on utilise un logiciel qui s’appelle système de gestion de base de données (SGBD, en anglais DBMS pour Database management system).

La taille, les capacités et les performances des bases de données et de leurs SGBD respectifs ont augmenté de plusieurs ordres de grandeur. Ces augmentations de performances ont été rendues possibles par les progrès technologiques dans différents domaines, tels que les domaines des processeurs, de la mémoire informatique, du stockage informatique et des réseaux informatiques. Le développement ultérieur de la technologie des bases de données peut être divisé en quatre générations basées sur le modèle ou la structure des données : navigation, relationnel, objet et post-relationnel.

#InterSystems IRIS #.NET #Bases de données #Bonnes pratiques #Données non structurées #Modèle de base de données de documents (NoSQL) #Modèle de données #Multi-model #Object Data Model #Tables relationnelles

9 4

0 725

Article Irène Mykhailova · Avr 12, 2023 4m read

Comment utiliser l'apprentissage automatique pour organiser la communauté - 2

Cet article est le deuxième d'une série expliquant comment créer un système d'apprentissage automatique de bout en bout.

Exploration des données

L'Intersystème IRIS dispose déjà de ce dont nous avons besoin pour explorer les données : un moteur SQL ! Pour les personnes qui ont l'habitude d'explorer des données dans des fichiers
csv ou des fichiers texte, cela pourrait aider à accélérer cette étape. Fondamentalement, nous explorons toutes les données pour comprendre l'intersection (jointures), ce qui devrait permettre de créer un jeu de données préparé pour être utilisé par un algorithme d'apprentissage automatique.

Tableau d'articles ( Fourni par l'équipe Intersystems )

Tableaude balises ( Fourni par l'équipe Intersystems )

#InterSystems IRIS #Machine Learning (ML) #Données non structurées #IntegratedML #Python

Open Exchange

0 0

0 75

Article Lorenzo Scalese · Juin 1, 2022 9m read

Modèle entité-attribut-valeur dans les bases de données relationnelles. Faut-il émuler les globales dans les tables ? Partie 2

Un système de stockage global d'aspect plus industriel

Dans le premier article de cette série, nous avons étudié le modèle entité-attribut-valeur (EAV) dans les bases de données relationnelles, et nous avons examiné les avantages et les inconvénients du stockage de ces entités, attributs et valeurs dans des tables. Nous avons appris que, malgré les avantages de cette approche en termes de flexibilité, elle présente de réels inconvénients, notamment une inadéquation fondamentale entre la structure logique des données et leur stockage physique, qui entraîne diverses difficultés.

Pour résoudre ces problèmes, nous avons décidé de voir si l'utilisation de globales - qui sont optimisées pour le stockage d'informations hiérarchiques - serait efficace pour les tâches que l'approche EAV traite habituellement.

Dans la Partie 1, nous avons créé un catalogue pour une boutique en ligne, d'abord en utilisant des tables, puis en utilisant une seule globale. Maintenant, essayons d'implémenter la même structure pour quelques globales.

Dans la première globale, ^catalog, nous allons stocker la structure du répertoire. Dans la deuxième globale, ^good, nous allons stocker les marchandises. Et dans la globale ^index, nous allons stocker les index. Puisque nos propriétés sont liées à un catalogue hiérarchique, nous ne créerons pas de globale séparée pour elles.

Avec cette approche, pour chaque entité (à l'exception des propriétés), nous avons une globale séparée, ce qui est bon du point de vue de la logique. Voici la structure du catalogue global :

#Caché #InterSystems IRIS #InterSystems IRIS for Health #Bases de données #Conseils et astuces #Données non structurées #Globals #Performances #SQL #Tables relationnelles

Open Exchange

2 0

0 474

Article Lorenzo Scalese · Mai 30, 2022 9m read

Modèle entité-attribut-valeur dans les bases de données relationnelles. Faut-il émuler les globales dans les tables ? Partie 1

Introduction

Dans le premier article de cette série, nous examinerons le modèle entité-attribut-valeur (EAV) dans les bases de données relationnelles pour voir comment il est utilisé et à quoi il sert. Ensuite, nous comparerons les concepts du modèle EAV aux globales.

Parfois, on dispose d'objets comportant un nombre inconnu de champs, ou peut-être des champs hiérarchiquement imbriqués, pour lesquels, en règle générale, il faut effectuer une recherche.

Par exemple, voici une boutique en ligne avec divers groupes de produits.

#InterSystems IRIS #Bases de données #Conseils et astuces #Données non structurées #Globals #Performances #SQL #Tables relationnelles

Open Exchange

2 0

0 1267

Ressources de la communauté des développeurs

Ressources InterSystems

#Données non structurées

Recherche vectorielle avec Embedded Python dans InterSystems IRIS

Balisage des données dans IRIS à l'aide de Python intégré et de l'API OpenAI

Des informations sur les données non structurées à l'aide de la recherche de texte SQL

Différents modèles de données dans InterSystems IRIS

Comment utiliser l'apprentissage automatique pour organiser la communauté - 2

Exploration des données

Tableau d'articles ( Fourni par l'équipe Intersystems )

Tableaude balises ( Fourni par l'équipe Intersystems )

Modèle entité-attribut-valeur dans les bases de données relationnelles. Faut-il émuler les globales dans les tables ? Partie 2

Un système de stockage global d'aspect plus industriel

Modèle entité-attribut-valeur dans les bases de données relationnelles. Faut-il émuler les globales dans les tables ? Partie 1

Introduction

La communauté en chiffres

Ressources de la communauté des développeurs

Ressources InterSystems

Nos réseaux sociaux

#Données non structurées

Exploration des données

Tableau d'articles ( Fourni par l'équipe Intersystems )

Tableaude balises ( Fourni par l'équipe Intersystems )

Un système de stockage global d'aspect plus industriel

Introduction

Applications populaires

La communauté en chiffres