ConvNetJS est une bibliothèque Javascript pour l'entraînement de modèles d'apprentissage profond (réseaux neuronaux) entièrement dans un navigateur.
Stanford CoreNLP fournit un ensemble d'outils d'analyse du langage naturel qui peuvent donner les formes de base des mots, leurs parties du discours, s'ils sont des noms d'entreprises, de personnes, etc., normaliser les dates, les heures et les quantités numériques, et marquer la structure des phrases en termes de phrases et de dépendances de mots, indiquer quelles syntagmes nominaux se réfèrent aux mêmes entités, indiquer le sentiment, extraire des relations de classe ouverte entre les mentions, etc.
Un étiqueteur de parties du discours (POS Tagger) est un logiciel qui lit le texte dans une langue et attribue des parties du discours à chaque mot (et autre jeton), comme le nom, le verbe, l'adjectif, etc., bien que généralement les applications informatiques utilisent des étiquettes de parties du discours plus détaillées comme 'nom-pluriel'.
Stanford Extraction et Diagnostic d'Information Basé sur des Modèles (SPIED) est une extraction d'entités basée sur des modèles et une visualisation qui fournit du code pour deux composants, Apprendre des entités à partir de texte non étiqueté en commençant par des ensembles de départ en utilisant des modèles de manière itérative et Visualiser et diagnostiquer le résultat d'un à deux systèmes.
Le segmentateur de mots de Stanford prend actuellement en charge l'arabe et le chinois, et les schémas de segmentation fournis ont été jugés efficaces pour une variété d'applications. Le système nécessite l'installation de Java 1.8+ et recommande au moins 1 Go de mémoire pour les documents contenant de longues phrases. Pour les fichiers avec des phrases plus courtes (par exemple, 20 tokens), réduisez l'exigence de mémoire en modifiant l'option java -mx1g dans les scripts d'exécution.
Stanford University Unstructured est un cadre open-source pour la simulation de dynamique des fluides computationnelle et la conception de formes optimales.
Tregex est un utilitaire pour faire correspondre des motifs dans des arbres, basé sur les relations d'arbre et les correspondances d'expressions régulières sur les nœuds (le nom est une abréviation de "tree regular expressions"). Tregex est accompagné de Tsurgeon, un langage de transformation d'arbres. Également inclus à partir de la version 2.0, un package similaire qui opère sur des graphes de dépendance (classe SemanticGraph), appelé semgrex.
Stanford Phrasal est un système de traduction automatique à base de phrases statistiques, écrit en Java, qui offre des fonctionnalités similaires à celles du cœur de Moses, notamment : une API facile à utiliser pour implémenter de nouvelles fonctionnalités de modèle de décodage, la capacité de traduire en utilisant des phrases qui incluent des lacunes (Galley et al. 2010), et l'extraction conditionnelle de tables de phrases et de modèles de réordonnancement lexical.
The Stanford NLP Group is a renowned research entity specializing in natural language processing within the Computer Science Department at Stanford University. This group focuses on advancing the field of computational linguistics, developing cutting-edge algorithms and models for understanding, processing, and generating human language. Their work spans various applications, including machine translation, sentiment analysis, information retrieval, and more. The group is also known for creating widely-used NLP tools and resources, such as the Stanford CoreNLP library.