Développé dans le cadre de la fondation Apache par Doug Cutting (un ancien salarié d'Excite), Nutch ( http://lucene.apache.org/nutch/ ) est un projet Open Source de moteur de recherche. En toute transparence, Nutch explique par exemple comment il calcule la pertinence d'un lien.
Après avoir indexé 34 millions de pages internet francophones, MisterBot repart donc à zéro mais mise sur cette technologie pour rapidement proposer un index de plusieurs centaines de millions de pages web.
Reste à savoir si ce contre temps lui permettra de s'imposer sur un marché
particulièrement concurrentiel, dominé par le trio Google / Yahoo / MSN mais où
évoluent également de nombreux challengers comme Voila, Exalead, Lycos ou encore
Ask.
Jérôme
Bouteiller