Datasets Open Source
Des jeux de donnees gratuits et librement reutilisables. Explorer, comparer, acceder aux sources.
French Legal Translation Compliance Dataset
ML / IAHigh Quality French Legal & Compliance Dataset This dataset contains high-quality labeled French business and compliance communications designed for AI training and NLP applications. Overview Language
Lexia French Legal V2
ML / IADataset Lexia French Legal V2 disponible sur HuggingFace pour le traitement du langage francais.
Lexia French Legal
ML / IADataset Lexia French Legal disponible sur HuggingFace pour le traitement du langage francais.
Brevets Francais 2017 Claims
ML / IADataset Brevets Francais 2017 Claims disponible sur HuggingFace pour le traitement du langage francais.
Brevets Francais 2019 Claims
ML / IADataset Brevets Francais 2019 Claims disponible sur HuggingFace pour le traitement du langage francais.
Brevets Francais 2020 Claims
ML / IADataset Brevets Francais 2020 Claims disponible sur HuggingFace pour le traitement du langage francais.
Brevets Francais 2022 Claims
ML / IADataset Brevets Francais 2022 Claims disponible sur HuggingFace pour le traitement du langage francais.
Brevets Francais 2025 Claims
ML / IADataset Brevets Francais 2025 Claims disponible sur HuggingFace pour le traitement du langage francais.
Brevets Francais 1981 2026 Clean
ML / IA🇫🇷 Brevets français 1981–2026 — Clean 🇫🇷 Dataset de brevets français publiés entre 1981 et 2026, extrait depuis les XML d’origine, avec un document = une ligne (texte complet). Format : Parquet, p
Brevets Francais 1981 2026 Raw
ML / IA🇫🇷 Brevets français 1981–2026 — Raw 🇫🇷 Dataset de brevets français publiés entre 1981 et 2026, extrait depuis les XML d’origine, avec un document = une ligne (texte complet). Format : Parquet Sour
Brevets Francais 2000 2026 Raw
ML / IADataset Brevets Francais 2000 2026 Raw disponible sur HuggingFace pour le traitement du langage francais.
Brevets Francais 2024 Chunked
ML / IA🇫🇷 Brevets français 2024 Chunké 🇫🇷 Dataset de brevets français publiés en 2024, extrait depuis les XML d’origine et chunké au niveau des balises xml Format : Parquet, prêt pour chargement streamin