據(jù)知情人士透露,微軟公司(MSFT.US)與新聞集團(tuán)-B(NWS.US)旗下的哈珀柯林斯出版公司達(dá)成協(xié)議,計(jì)劃利用后者豐富的非小說(shuō)類圖書(shū)資源來(lái)訓(xùn)練其人工智能模型,以提升模型的質(zhì)量和性能。這一合作僅限于使用精選的舊書(shū)進(jìn)行模型訓(xùn)練,并不涉及創(chuàng)作新書(shū),且作者有權(quán)選擇是否參與。
具體而言,微軟希望將哈珀柯林斯圖書(shū)納入其尚未公布的人工智能模型中,以拓展高質(zhì)量文本來(lái)源,提高模型的準(zhǔn)確性和專業(yè)知識(shí)提供能力。盡管微軟拒絕置評(píng),但哈珀柯林斯已證實(shí)了這一協(xié)議,并表示該協(xié)議將“允許有限使用精選的非小說(shuō)類舊書(shū)來(lái)訓(xùn)練人工智能模型”。
同時(shí),哈珀柯林斯強(qiáng)調(diào),這一協(xié)議的范圍有限,對(duì)尊重作者權(quán)利的模范產(chǎn)出有明確的限制,作者可以選擇是否參與。
“我們的任務(wù)之一是為作者們創(chuàng)造機(jī)遇,讓他們深思熟慮,同時(shí)確保他們作品的核心價(jià)值以及我們共同享有的收入和版稅得到保護(hù),”哈珀柯林斯表示?!斑@份協(xié)議范圍有限,對(duì)那些尊重作者權(quán)益的杰出作品設(shè)定了明確的界限,它成功地實(shí)現(xiàn)了這一目標(biāo)。”
據(jù)了解,科技公司一直在尋找更多高質(zhì)量文本來(lái)源來(lái)訓(xùn)練人工智能模型,微軟等公司也不例外。他們通過(guò)獲得許可,使用從社交媒體網(wǎng)站到新聞文章的一系列數(shù)據(jù),以使他們的程序更準(zhǔn)確、更好地回答問(wèn)題或提供特定主題的專業(yè)知識(shí)。
值得一提的是,新聞集團(tuán)此前已與OpenAI簽署協(xié)議,允許其使用旗下多家出版物的內(nèi)容。微軟也與多家出版商合作開(kāi)展人工智能項(xiàng)目。
此外,今年早些時(shí)候,谷歌與Reddit達(dá)成了一項(xiàng)價(jià)值6000萬(wàn)美元的協(xié)議,使得這家搜索巨頭能夠利用大量的subreddits來(lái)訓(xùn)練其AI模型。
然而,一些出版商對(duì)人工智能公司未經(jīng)許可引用內(nèi)容的行為表示不滿,并提起訴訟。例如,《紐約時(shí)報(bào)》起訴了OpenAI和微軟,指控其侵犯版權(quán)。
綜上所述,微軟與哈珀柯林斯達(dá)成的協(xié)議標(biāo)志著科技公司在尋求高質(zhì)量文本來(lái)源以訓(xùn)練人工智能模型方面的又一重要進(jìn)展。然而,如何在利用這些資源的同時(shí)尊重作者權(quán)利,仍是出版商和科技公司需要共同面對(duì)的挑戰(zhàn)。
發(fā)表評(píng)論