Datacurve, une startup issue de Y Combinator spécialisée dans la collecte de données d'entraînement pour l'intelligence artificielle, a annoncé une levée de fonds de 15 millions de dollars en série A menée par Chemistry VC avec la participation d'employés de DeepMind, Vercel, Anthropic et OpenAI. Cette opération financière intervient dans un contexte où la concurrence pour l'obtention de données de qualité s'intensifie dans l'industrie de l'IA, particulièrement après le départ d'Alexandr Wang de ScaleAI pour Meta.

La startup se distingue par son système de « chasseurs de primes » qui attire des ingénieurs logiciels hautement qualifiés pour constituer les jeux de données les plus difficiles à sourcer. Jusqu'à présent, Datacurve a distribué plus d'un million de dollars en primes via cette méthode. Cependant, selon Serena Ge, cofondatrice, la motivation principale n'est pas financière car les rémunérations pour le travail sur les données restent bien inférieures aux salaires conventionnels dans le développement logiciel.

L'avantage concurrentiel de Datacurve réside dans son approche centrée sur l'expérience utilisateur, traitant sa plateforme comme un produit grand public plutôt que comme une simple opération d'étiquetage de données. Cette orientation devient cruciale alors que les besoins en données post-entraînement deviennent plus complexes, nécessitant des environnements d'apprentissage par renforcement sophistiqués qui exigent une collecte stratégique et spécifique. La startup se concentre actuellement sur le domaine du génie logiciel mais envisage d'étendre son modèle à d'autres secteurs comme la finance, le marketing ou la médecine.