美联社资料图 美国中文网报道 据媒体周四报道,OpenAI计划扩大与外部组织的合作,从多种语言、主题和文化中收集数据,以构建任何人都可以使用的公共数据集,帮助训练更广泛的人工智能工具。 该公司当天表示,希望团体和社区与其联系,在数据方面进行合作,目标是收集“反映人类社会”的大量数据。该公司还表示,正在致力于制作私人数据集,例如组织或公司不想与他人共享的数据,这些数据也可用于训练人工智能。 OpenAI总裁格雷格·布罗克曼 (Greg Brockman) 在周三接受彭博社采访时表示:“我们确实认为每一种语言、每一项人类努力和活动都可以使这些模型受益。如果模型中有更多的数据,模型在该领域的表现就越出色。” OpenAI表示,希望将文本、图像、音频和视频纳入其中,而普通公众尚无法轻松在线访问这些内容。该公司表示,已经与合作伙伴合作,建立来自不同国家和行业的培训数据,其中包括冰岛政府和科技公司Miðeind ehf,后者使用人工智能来保护冰岛语。这使得OpenAI能够提高其GPT-4 AI模型接受冰岛语提示并根据上下文以英语和冰岛语做出响应的能力。 (编辑:Lori Chang) |