Claude d'Anthropic rivalise avec les experts en bioinformatique
Anthropic dévoile BioMysteryBench, un benchmark de 99 questions en bioinformatique pour évaluer Claude. Le modèle atteint 82,6% de précision sur les tâches résolubles par des experts, mais seulement 30% sur les plus complexes. Les résultats sont comparables à ceux du benchmark CompBioBench de Genentech et Roche.