Nouveau : Datasets open source gratuits disponibles !Decouvrir →

Datasets Open Source

Des jeux de donnees gratuits et librement reutilisables. Explorer, comparer, acceder aux sources.

219 datasets 13 categories 4 formats
🤖

Livres Libres De Droit Francais

ML / IA

Dataset Livres Libres De Droit Francais disponible sur HuggingFace pour le traitement du langage francais.

Parquet Voir la source
🏛️

French Orca Dpo Pairs

Gouvernement

Dataset Card for french_orca_dpo_pairs This dataset offers a french translation of the 12k DPO Intel/orca_dpo_pairs pairs made from Open-Orca/OpenOrca. Dataset Card Contact ntnq

Parquet Voir la source
🤖

Wikisource

ML / IA

Plain text of Wikisource Dataset Description Size Example use (python) Data fields Notes on data formatting License Aknowledgements Citation Dataset Description This dataset is a plain text version of

Parquet Voir la source
🤖

Wiktionary

ML / IA

Plain text of French Wiktionary Dataset Description Size Example use (python) Data fields Notes on data formatting License Aknowledgements Citation Dataset Description This dataset is a plain text ver

Parquet Voir la source
🤖

Mt Bench French

ML / IA

MT-Bench-French This is a French version of MT-Bench, created to evaluate the multi-turn conversation and instruction-following capabilities of LLMs. Similar to its original version, MT-Bench-French c

Parquet Voir la source
🤖

Wikipedia French

ML / IA

Dataset Wikipedia French disponible sur HuggingFace pour le traitement du langage francais.

Parquet Voir la source
🤖

French Wolof Translation

ML / IA

Parquet Voir la source
🤖

Claire Dialogue French 0.1

ML / IA

Claire French Dialogue Dataset (CFDD) A collection of French dialogue transcripts and plays This is the first packaged version of the datasets used to train the Claire family of large language models

Parquet Voir la source

Catégorisation de l'offre de transport en commun - Plan de mobilité

Sport

Catégorisation de l'offre de transport en commun du Plan Mobilité de la MEL dans laquelle le niveau d'offre associé à chaque périmètre est déterminé par le nombre moyen de dessertes quotidiennes de l’

CSV lov2
🤖

Elections sénatoriales 2023 - Résultats

ML / IA

Résultats des élections sénatoriales du dimanche 24 septembre 2023 : scrutin majoritaire tour 1, scrutin majoritaire tour 2, scrutin proportionnel et liste des élus.

XLSX 63 Ko notspecified
🏛️

English French Songs Lyrics Translation Original

Gouvernement

Original Songs Lyrics with French Translation Dataset Summary Dataset of 99289 songs containing their metadata (author, album, release date, song number), original lyrics and lyrics translated into Fr

Parquet Voir la source
🤖

French Wikipedia Articles

ML / IA

Dump of 2023-08-20 of all french article in wikipedia https://dumps.wikimedia.org/frwiki/20230820/frwiki-20230820-pages-articles.xml.bz2

Parquet Voir la source

Chaque semaine, le meilleur de la tech francaise

Tendances, salaires, outils et opportunites — directement dans votre boite mail.

Gratuit. Desabonnement en un clic. Pas de spam.