Nutch

Nutch
Logo

Développeur Doug Cutting
Dernière version 1.12 ()
2.3.1 () Voir et modifier les données sur Wikidata
Écrit en Java Voir et modifier les données sur Wikidata
Environnement Windows, Mac OS X, GNU/ Linux
Type moteur de recherche open source
Licence Licence Apache Voir et modifier les données sur Wikidata
Site web nutch.apache.org
lucene.apache.org/nutch Voir et modifier les données sur Wikidata

Nutch est une initiative visant à construire un moteur de recherche open source. Il utilise Lucene comme bibliothèque de moteur de recherche et d'indexation. En revanche, le robot de collecte a été créé spécifiquement pour ce projet.

L'architecture de Nutch est hautement modulaire et permet à des développeurs de créer des plugins pour différentes phases du processus : récupération des données, analyse des documents, recherche, etc.

Doug Cutting est l'initiateur et le coordinateur de ce projet.

Il est entièrement développé en langage Java, mais les données qu'il manipule sont dans un format de données indépendant de tout langage de programmation. En juin 2003 a été présenté une version opérationnelle d'une démonstration de Nutch sur une base regroupant 100 millions de documents.

Historique

CreativeCommons.org s'appuie sur Nutch

Creative Commons inaugure en 2004 une beta version de son moteur de recherche qui parcourt le web à la recherche de texte, de son audio et de vidéo, indexant à cette date un million de pages ; tout cela réutilisable librement selon les termes des licences mis à disposition sur leur site web [1].

Leur moteur de recherche s'appuie le Resource Description Framework (RDF) qui utilise le méta-langage XML, standardisé par le World Wide Web Consortium (W3C).

Cette sortie coïncide avec celle du navigateur Web Mozilla Firefox dans sa version 1.0, rendant par la même possible la recherche de contenu libre.

Nutch rejoint Apache

En janvier 2005, Nutch est un projet de deux ans d'âge qui a d'abord été hébergé par Sourceforge et soutenu par sa propre organisation à but non lucratif. Cette organisation a été fondée dans le but de donner un copyright au projet et de pouvoir garder le droit de changer la licence. L'équipe a décidé que la licence Apache était la plus appropriée pour Nutch et qu'il n'avait plus besoin de l'aide d'une organisation extérieure. Les dirigeants et les développeurs sont maintenant soutenus par la fondation Apache.

Après cinq mois d'incubation, Nutch devient un sous-projet de Lucene.

Other Languages
català: Nutch
Deutsch: Nutch
English: Apache Nutch
español: Nutch
italiano: Nutch
한국어: 너치
Nederlands: Apache Nutch
русский: Nutch
Türkçe: Nutch
українська: Nutch