南昌一中掏脑子挖眼睛完整版_极品太监猎美传奇_太阳是奶酪做的(h)(弓行永夜)_男生宿舍的公共小受_小东西好几天没弄你了最新章节

13560189272
1536490903
1543176717

行業(yè)門(mén)戶

NEWS CENTRE

首頁(yè)

>

>

NEAR：為何AI需要Web3？Web3究竟會(huì)給AI帶來(lái)什么樣的顛覆式進(jìn)步

NEAR：為何AI需要Web3？Web3究竟會(huì)給AI帶來(lái)什么樣的顛覆式進(jìn)步

2024-04-24 閱讀：247

Why AI Needs to be Open

讓我們來(lái)探討一下“為什么人工智能需要開(kāi)放”。我的背景是Machine Learning，在我的職業(yè)生涯中大約有十年的時(shí)間一直在從事各種機(jī)器學(xué)習(xí)的工作。但在涉足Crypto、自然語(yǔ)言理解和創(chuàng)立NEAR之前，我曾在谷歌工作。我們現(xiàn)在開(kāi)發(fā)了驅(qū)動(dòng)大部分現(xiàn)代人工智能的框架，名為T(mén)ransformer。離開(kāi)谷歌之后，我開(kāi)始了一家Machine Learning公司，以便我們能夠教會(huì)機(jī)器編程，從而改變我們?nèi)绾闻c計(jì)算機(jī)互動(dòng)。但我們沒(méi)有在2017或者18年這樣做，那時(shí)候太早了，當(dāng)時(shí)也沒(méi)有計(jì)算能力和數(shù)據(jù)來(lái)做到這一點(diǎn)。

我們當(dāng)時(shí)所做的是吸引世界各地的人們?yōu)槲覀冏鰳?biāo)注數(shù)據(jù)的工作，大多數(shù)是學(xué)生。他們?cè)谥袊?guó)、亞洲和東歐。其中許多人在這些國(guó)家沒(méi)有銀行賬戶。美國(guó)不太愿意輕易匯款，所以我們開(kāi)始想要使用區(qū)塊鏈作為我們問(wèn)題的解決方案。我們希望以一種程序化的方式向全球的人們支付，無(wú)論他們身在何處，都能讓這變得更加容易。順便說(shuō)一句，Crypto的目前挑戰(zhàn)是，現(xiàn)在雖然NEAR解決了很多問(wèn)題，但通常情況下，你需要先購(gòu)買(mǎi)一些Crypto，才能在區(qū)塊鏈上進(jìn)行交易來(lái)賺取，這個(gè)過(guò)程反其道而行了。

就像企業(yè)一樣，他們會(huì)說(shuō)，嘿，首先，你需要購(gòu)買(mǎi)一些公司的股權(quán)才能使用它。這是我們NEAR正在解決的很多問(wèn)題之一?，F(xiàn)在讓我們稍微深入討論一下人工智能方面。語(yǔ)言模型并不是什么新鮮事物，50年代就存在了。它是一種在自然語(yǔ)言工具中被廣泛使用的統(tǒng)計(jì)工具。很長(zhǎng)一段時(shí)間以來(lái)，從2013年開(kāi)始，隨著深度學(xué)習(xí)重新被重新啟動(dòng)，一種新的創(chuàng)新就開(kāi)始了。這種創(chuàng)新是你可以匹配單詞，新增到多維度的向量中并轉(zhuǎn)換為數(shù)學(xué)形式。這與深度學(xué)習(xí)模型配合得很好，它們只是大量的矩陣乘法和激活函數(shù)。

這使我們能夠開(kāi)始進(jìn)行先進(jìn)的深度學(xué)習(xí)，并訓(xùn)練模型來(lái)做很多有趣的事情?，F(xiàn)在回顧起來(lái)，我們當(dāng)時(shí)正在做的是神經(jīng)元神經(jīng)網(wǎng)絡(luò)，它們?cè)诤艽蟪潭壬鲜悄７氯祟惖哪Ｐ?，我們一次可以讀取一個(gè)單詞。因此，這樣做速度非常慢，對(duì)吧。如果你試圖在Google.com上為用戶展示一些內(nèi)容，沒(méi)有人會(huì)等待去閱讀維基百科，比如說(shuō)五分鐘后才給出答案，但你希望馬上得到答案。因此，Transformers 模型，也就是驅(qū)動(dòng)ChatGPT、Midjourney以及所有最近的進(jìn)展的模型，都是同樣來(lái)自這樣的想法，都希望有一個(gè)能夠并行處理數(shù)據(jù)、能夠推理、能夠立即給出答案。

因此這個(gè)想法在這里的一個(gè)主要?jiǎng)?chuàng)新是，即每個(gè)單詞、每個(gè)token、每個(gè)圖像塊都是并行處理的，利用了我們具有高度并行計(jì)算能力的GPU和其他加速器。通過(guò)這樣做，我們能夠以規(guī)?；姆绞綄?duì)其進(jìn)行推理。這種規(guī)?；軌驍U(kuò)大訓(xùn)練規(guī)模，從而處理自動(dòng)訓(xùn)練數(shù)據(jù)。因此，在此之后，我們看到了 Dopamine，它在短時(shí)間內(nèi)做出了驚人的工作，實(shí)現(xiàn)了爆炸式的訓(xùn)練。它擁有大量的文本，開(kāi)始在推理和理解世界語(yǔ)言方面取得了驚人的成果。

現(xiàn)在的方向是加速創(chuàng)新人工智能，之前它是一種數(shù)據(jù)科學(xué)家、機(jī)器學(xué)習(xí)工程師會(huì)使用的一種工具，然后以某種方式，解釋在他們的產(chǎn)品中或者能夠去與決策者討論數(shù)據(jù)的內(nèi)容?，F(xiàn)在我們有了這種 AI 直接與人交流的模式。你甚至可能都不知道你在與模型交流，因?yàn)樗鼘?shí)際上隱藏在產(chǎn)品背后。因此，我們經(jīng)歷了這種轉(zhuǎn)變，從之前那些理解AI 如何工作的，轉(zhuǎn)變成了理解并能夠?qū)⑵涫褂谩?/p>

因此，我在這里給你們一些背景，當(dāng)我們說(shuō)我們?cè)谑褂肎PU來(lái)訓(xùn)練模型時(shí)，這不是我們桌面上玩視頻游戲時(shí)用的那種游戲GPU。

每臺(tái)機(jī)器通常配備八個(gè)GPU，它們都通過(guò)一個(gè)主板相互連接，然后堆疊成機(jī)架，每個(gè)機(jī)架大約有16臺(tái)機(jī)器?，F(xiàn)在，所有這些機(jī)架也都通過(guò)專用的網(wǎng)絡(luò)電纜相互連接，以確保信息可以在GPU之間直接極速傳輸。因此，信息不適合CPU。實(shí)際上，你根本不會(huì)在CPU上處理它。所有的計(jì)算都發(fā)生在GPU上。所以這是一個(gè)超級(jí)計(jì)算機(jī)設(shè)置。再次強(qiáng)調(diào)，這不是傳統(tǒng)的“嘿，這是一個(gè)GPU的事情”。所以規(guī)模如GPU4的模型在大約三個(gè)月的時(shí)間里使用了10,000個(gè)H100進(jìn)行訓(xùn)練，費(fèi)用達(dá)到6400萬(wàn)美元。大家了解當(dāng)前成本的規(guī)模是什么樣的以及對(duì)于訓(xùn)練一些現(xiàn)代模型的支出是多少。

重要的是，當(dāng)我說(shuō)系統(tǒng)是相互連接的時(shí)候，目前H100的連接速度，即上一代產(chǎn)品，是每秒900GB，計(jì)算機(jī)內(nèi)部 CPU 與 RAM 之間的連接速度是每秒 200GB，都是電腦本地的。因此，在同一個(gè)數(shù)據(jù)中心內(nèi)從一個(gè)GPU發(fā)送數(shù)據(jù)到另一個(gè)GPU的速度比你的計(jì)算機(jī)還快。你的計(jì)算機(jī)基本上可以在箱子里自己進(jìn)行通信。而新一代產(chǎn)品的連接速度基本上是每秒1.8TB。從開(kāi)發(fā)者的角度來(lái)看，這不是一個(gè)個(gè)體的計(jì)算單元。這些是超級(jí)計(jì)算機(jī)，擁有一個(gè)巨大的內(nèi)存和計(jì)算能力，為你提供了極大規(guī)模的計(jì)算。

現(xiàn)在，這導(dǎo)致了我們面臨的問(wèn)題，即這些大公司擁有資源和能力來(lái)構(gòu)建這些模型，這些模型現(xiàn)在幾乎已經(jīng)為我們提供了這種服務(wù)，我不知道其中究竟有多少工作，對(duì)吧？所以這就是一個(gè)例子，對(duì)吧？你去找一個(gè)完全集中式的公司提供者，然后輸入一個(gè)查詢。結(jié)果是，有幾個(gè)團(tuán)隊(duì)并不是軟件工程團(tuán)隊(duì)，而是決定結(jié)果如何顯示的團(tuán)隊(duì)，對(duì)吧？你有一個(gè)團(tuán)隊(duì)決定哪些數(shù)據(jù)進(jìn)入數(shù)據(jù)集。

舉個(gè)例子，如果你只是從互聯(lián)網(wǎng)上爬取數(shù)據(jù)，關(guān)于巴拉克·奧巴馬出生在肯尼亞和巴拉克·奧巴馬出生在夏威夷的次數(shù)是完全相同的，因?yàn)槿藗兿矚g猜測(cè)爭(zhēng)議。所以你要決定要在什么上進(jìn)行訓(xùn)練。你要決定過(guò)濾掉一些信息，因?yàn)槟悴幌嘈胚@是真的。因此，若像這樣的個(gè)人已經(jīng)決定哪些數(shù)據(jù)會(huì)被采用且存在這些數(shù)據(jù)，這些決定在很大程度上是由做出它們的人所影響的。你有一個(gè)法律團(tuán)隊(duì)決定我們不能查看哪些內(nèi)容是受版權(quán)保護(hù)，哪些是非法的。我們有一個(gè)“道德團(tuán)隊(duì)”決定什么是不道德的，我們不應(yīng)該展示什么內(nèi)容。

所以在某種程度上，有很多這樣的過(guò)濾和操縱行為。這些模型是統(tǒng)計(jì)模型。它們會(huì)從數(shù)據(jù)中挑選出來(lái)。如果數(shù)據(jù)中沒(méi)有某些內(nèi)容，它們就不會(huì)知道答案。如果數(shù)據(jù)中有某些內(nèi)容，它們很可能會(huì)將其視為事實(shí)?，F(xiàn)在，當(dāng)你從AI得到一個(gè)回答時(shí)，這可能會(huì)令人擔(dān)憂。對(duì)吧。現(xiàn)在，你理應(yīng)是從模型那里得到回答，但是沒(méi)有任何的保證。你不知道結(jié)果是如何生成的。一個(gè)公司可能會(huì)把你的特定會(huì)話賣(mài)給出價(jià)最高的人來(lái)實(shí)際改變結(jié)果。想象一下，你去詢問(wèn)應(yīng)該買(mǎi)哪種車，豐田公司決定覺(jué)得應(yīng)該偏向豐田這個(gè)結(jié)果，豐田將支付這家公司10美分來(lái)做到這一點(diǎn)。

因此，即使你將這些模型用作應(yīng)該中立并代表數(shù)據(jù)的知識(shí)庫(kù)，實(shí)際上在你得到結(jié)果之前，會(huì)發(fā)生很多事情，這些事情會(huì)以一種非常特定的方式對(duì)結(jié)果進(jìn)行偏見(jiàn)。這已經(jīng)引發(fā)了很多問(wèn)題，對(duì)吧？這基本上就是大公司和媒體之間不同法律訴訟的一個(gè)星期。SEC，現(xiàn)在幾乎每個(gè)人都在試圖起訴對(duì)方，因?yàn)檫@些模型帶來(lái)了如此多的不確定性和權(quán)力。而且，如果往前看，問(wèn)題在于大型科技公司將永遠(yuǎn)有繼續(xù)增加收入的動(dòng)機(jī)，對(duì)吧？比如，如果你是一家上市公司，你需要報(bào)告收入，你需要繼續(xù)保持增長(zhǎng)。

為了實(shí)現(xiàn)這一目標(biāo)，如果你已經(jīng)占據(jù)了目標(biāo)市場(chǎng)，比如說(shuō)你已經(jīng)有20億用戶了。在互聯(lián)網(wǎng)上已經(jīng)沒(méi)有那么多新用戶了。你沒(méi)有太多的選擇，除了最大化平均收入，這意味著你需要從用戶那里提取更多的價(jià)值，而他們可能根本沒(méi)有什么價(jià)值，或者你需要改變他們的行為。生成式人工智能非常擅長(zhǎng)于操縱和改變用戶的行為，特別是如果人們認(rèn)為它是以一切知識(shí)智能的形式出現(xiàn)的。因此，我們面臨著這種非常危險(xiǎn)的情況，在這種情況下，監(jiān)管壓力很大，監(jiān)管機(jī)構(gòu)并不完全了解這項(xiàng)技術(shù)的工作原理。我們幾乎沒(méi)有保護(hù)用戶免受操縱的情況。

操縱性內(nèi)容、誤導(dǎo)性內(nèi)容，即使沒(méi)有廣告，你也可以只是截取一些東西的屏幕截圖，改變標(biāo)題，發(fā)布到Twitter上，人們就會(huì)發(fā)瘋。你有經(jīng)濟(jì)激勵(lì)機(jī)制，導(dǎo)致你不斷地最大化收入。而且，這實(shí)際上不像在谷歌內(nèi)部你是在做惡事，對(duì)吧？當(dāng)你決定啟動(dòng)哪個(gè)模型時(shí)，你會(huì)進(jìn)行A或B測(cè)試，看看哪個(gè)能帶來(lái)更多收入。因此，你會(huì)通過(guò)從用戶那里提取更多價(jià)值來(lái)不斷地最大化收入。而且，用戶和社區(qū)并沒(méi)有對(duì)模型的內(nèi)容、使用的數(shù)據(jù)以及實(shí)際嘗試實(shí)現(xiàn)的目標(biāo)有任何輸入。這就是應(yīng)用程序用戶的情況。這是一種調(diào)節(jié)。

這就是為什么我們要不斷推動(dòng)WEB 3和AI融合的原因，web 3 可以是一種重要的工具，它允許我們有新的激勵(lì)方式，并且還是以去中心化的形式去激勵(lì)我們生產(chǎn)更好的軟件和產(chǎn)品。這是整個(gè)web 3 AI 開(kāi)發(fā)的大方向，現(xiàn)在為了幫助理解細(xì)節(jié)，我會(huì)簡(jiǎn)單講一下具體的部分，首先第一部分是Content Reputation。

再次強(qiáng)調(diào)，這不是一個(gè)純粹的人工智能問(wèn)題，盡管語(yǔ)言模型為人們操縱和利用信息帶來(lái)了巨大的影響力并擴(kuò)大了規(guī)模。你想要的是一種可以追蹤的、可追溯的加密聲譽(yù)，當(dāng)你查看不同的內(nèi)容時(shí)，它會(huì)顯現(xiàn)出來(lái)。所以想象一下，你有一些社區(qū)節(jié)點(diǎn)，它們實(shí)際上是加密的，并且在每個(gè)網(wǎng)站的每個(gè)頁(yè)面上都可以找到。現(xiàn)在，如果你超越這一點(diǎn)，所有這些分發(fā)平臺(tái)都將會(huì)受到干擾，因?yàn)檫@些模型現(xiàn)在幾乎將閱讀所有這些內(nèi)容并為你提供個(gè)性化摘要和個(gè)性化輸出。

因此，我們實(shí)際上有機(jī)會(huì)創(chuàng)造新的創(chuàng)造性內(nèi)容，而不是試圖重新發(fā)明，讓我們?cè)诂F(xiàn)有內(nèi)容上加上區(qū)塊鏈和NFTs。圍繞模型訓(xùn)練和推理時(shí)間的新創(chuàng)作者經(jīng)濟(jì)，人們創(chuàng)造的數(shù)據(jù)，無(wú)論是新的出版物、照片、YouTube、還是你創(chuàng)作的音樂(lè)，都將進(jìn)入一個(gè)基于其對(duì)模型訓(xùn)練的貢獻(xiàn)程度的網(wǎng)絡(luò)。因此，根據(jù)這一點(diǎn)，根據(jù)內(nèi)容可以在全球范圍內(nèi)獲得一些報(bào)酬。因此，我們從現(xiàn)在由廣告網(wǎng)絡(luò)推動(dòng)的吸引眼球的經(jīng)濟(jì)模式過(guò)渡到了真正帶來(lái)創(chuàng)新和有趣信息的經(jīng)濟(jì)模式。

我想提一件重要的事情，那就是大量的不確定性來(lái)自浮點(diǎn)運(yùn)算。所有這些模型都涉及大量的浮點(diǎn)運(yùn)算和乘法。這些都是不確定性的操作。

現(xiàn)在，如果你將它們?cè)诓煌軜?gòu)的GPU上進(jìn)行乘法運(yùn)算。所以你拿一個(gè)A100和一個(gè)H100，結(jié)果會(huì)有所不同。因此，很多依賴確定性的方法，比如加密經(jīng)濟(jì)和樂(lè)觀主義，實(shí)際上會(huì)遇到很多困難，并且需要很多創(chuàng)新才能實(shí)現(xiàn)這一點(diǎn)。最后，有一個(gè)有趣的想法，我們一直在構(gòu)建可編程貨幣和可編程資產(chǎn)，但是如果你能想象一下，你給它們添加這種智能，你就可以有智能資產(chǎn)，它們現(xiàn)在不是由代碼定義的，而是由自然語(yǔ)言與世界互動(dòng)的能力來(lái)定義，對(duì)吧？這就是我們可以有很多有趣的收益優(yōu)化、DeFi，我們可以在世界內(nèi)部進(jìn)行交易策略。

現(xiàn)在的挑戰(zhàn)在于所有當(dāng)前事件都不具備強(qiáng)大的Robust行為。它們并沒(méi)有被訓(xùn)練成具有對(duì)抗性的強(qiáng)大性，因?yàn)橛?xùn)練的目的是預(yù)測(cè)下一個(gè)token。因此，說(shuō)服一個(gè)模型給你所有的錢(qián)會(huì)更容易。在繼續(xù)之前，實(shí)際上解決這個(gè)問(wèn)題非常重要。所以我就給你留下這個(gè)想法，我們處在一個(gè)十字路口上，對(duì)吧？有一個(gè)封閉的人工智能生態(tài)系統(tǒng)，它有極端的激勵(lì)和飛輪，因?yàn)楫?dāng)他們推出一個(gè)產(chǎn)品時(shí)，他們會(huì)產(chǎn)生大量的收入，然后把這些收入投入到建設(shè)產(chǎn)品中。但是，該產(chǎn)品天生就是為了最大化公司的收入，從而最大化從用戶那里提取的價(jià)值?；蛘呶覀冇羞@種開(kāi)放、用戶擁有的方法，用戶掌控著局面。

這些模型實(shí)際上對(duì)你有利的，試圖最大化你的利益。它們?yōu)槟闾峁┝艘环N方式，真正保護(hù)你免受在互聯(lián)網(wǎng)上的許多危險(xiǎn)。所以這就是為什么我們需要AI x Crypto更多的開(kāi)發(fā)和應(yīng)用。謝謝大家。

上一篇：“對(duì)于金融來(lái)說(shuō)，人工智能不是‘術(shù)’，而是‘道’”

下一篇：日月譚天丨大陸的APP為什么在島內(nèi)年輕人中這么香？

13560189272

地址：廣州市天河區(qū)黃埔大道西201號(hào)金澤大廈808室

COPYRIFHT ? 2010-2020 廣州市名聯(lián)網(wǎng)絡(luò)科技有限公司 ALL RIGHTS RESERVED 粵ICP備10203057號(hào)

這里是二維碼