当前位置:首页 > 国际 > 正文

由微软和OpenAI支持的哈佛新开源数据集推动人工智能的发展

  • 国际
  • 2024-12-25 09:44:06
  • 5
哈佛大学发布了大量免费的人工智能训练数据集,人工智能突飞猛进。在微软和OpenAI的支持下,这个数据集为人工智能初创公司提供了公平的竞争环境。它包含各种各样的文本,使其成为机器学习开发人员的关键资源。这一举措出台之际,围绕人工智能训练数据使用的版权问题正在进行辩论。
Wired

由微软和OpenAI支持的哈佛新开源数据集推动人工智能的发展

人工智能训练数据集革命

哈佛大学最近宣布与微软OpenAI确实成为了人工智能世界中令人兴奋的火花。新的数据集旨在提供前所未有的文本访问,从文学经典到小众学术材料,旨在加强人工智能模型的训练。

海量数据集概述

这个数据集大约比臭名昭著的Books3数据集大5倍。它由机构数据倡议(Institutional Data Initiative)提出,包含了跨越流派、时代和语言的作品。莎士比亚和但丁等作家的经典文学将与专业文本共存。

对人工智能发展的影响

执行董事格雷格Leppert强调了这个项目的目的

本文根据道德政策的原则,使用了来自开放资源的信息。编辑团队不负责绝对的准确性,因为它依赖于参考来源的数据。

有话要说...