IT之家OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力 Telegraph | 原文 | 🔔科技频道[奇诺分享-ccino.org]⚡️

IT之家
OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力 Telegraph | 原文

OpenAI 推出 GeneBench-Pro 基准测试，用于评估 AI 模型生物学计算能力 - IT之家

IT之家 7 月 1 日消息，OpenAI 宣布推出 GeneBench-Pro 基准测试，主要用于评估 AI 模型在生物学计算任务中的真实研究能力，重点衡量模型面对杂乱数据时的分析判断、方法选择，以及研究结果是否足以支撑后续决策。据介绍，相比传统基准测试通常聚焦在“模型是否记住知识”或“能否按固定流程完成任务”，GeneBench-Pro 更强调在真实科研环境中的实用性，让模型面对“模糊、不完整、甚至带有干扰的数据环境”，令其判断分析得出结论。具体来看，GeneBench-Pro 基准测试任务覆盖…

Powered by BroadcastChannel & Sepia