第一百一十一章 煉丹
頭上懸著三把劍:
如何逆轉(zhuǎn)非編碼區(qū)基因突變進(jìn)程?
腺病毒如何通過影響非編碼RNA影響植物?
倒計(jì)時2548天。
每當(dāng)看到著四行字時,盧赫都覺得真的有一個大寶劍虛貼在自己的后腦勺上,好像下一秒就要被破瓢。
頭痛。
不過并不是每一個人都像他一樣痛苦。因?yàn)榈褂?jì)時的盡頭是什么,只有少數(shù)人知曉。
事實(shí)上,也就是像他一樣的小年輕才會糾結(jié)為什么會從13年縮水到7年?;爝^職場的老油條對此都是見怪不怪的:
拖延癥是打工人的專屬,領(lǐng)導(dǎo)們一般都有強(qiáng)迫癥和妄想癥。因?yàn)樗麄兛偸呛薏坏庙?xiàng)目一申下來,立刻就給做完。
所以重要的時間節(jié)點(diǎn),一般都會往前定,給出一定的余量與緩沖。對于這種關(guān)乎人類存亡的事情,余量6年更是無可厚非。
至于7年的真正緣由誰知道誰不知道,分辨起來也很簡單。
只要搬把椅子坐到門口,翹著二郎腿,心不在焉地掃一眼來人的表情,便可輕易知曉:
剛被奇奇怪怪的早餐摧殘過,神情呆滯地直視一眼橫幅便一股腦往里沖的,大概率是不知道的。
本來腳步輕快,卻在看到橫幅后停頓一下,然后開始皺眉的,大概率是知道的。
雖然這個鑒別同胞的想法在盧赫腦中存在很久了,但他從未真正實(shí)踐過。
因?yàn)檠芯康耐七M(jìn)比他想象得要快,短短幾天內(nèi),基于海晝天基因組的數(shù)據(jù)集已經(jīng)建好了,他們可以開始煉丹了。
之所以稱之為煉丹,是因?yàn)闄C(jī)器學(xué)習(xí)模型的訓(xùn)練過程,受到超參數(shù)的影響。
所謂超參數(shù)就是人為預(yù)先設(shè)定的參數(shù),設(shè)得好,模型訓(xùn)練得就快;設(shè)得不好,模型可能壓根就不收斂。
至于什么是好,什么是不好,只有全知全能老天爺才能知道。
天心最難揣度。
說到底,除了扎實(shí)的基礎(chǔ)和豐富的經(jīng)驗(yàn)以外,想要快速訓(xùn)練出一個能用的模型、煉出一個能不把人吃死的丹藥,運(yùn)氣最重要。
而煉丹是要時間的,七七四十九天之后,如果這丹藥不能用,那么這時間就被完全浪費(fèi)掉了。
所以,他跟著那幫專業(yè)煉丹的人開了大半天的會,討論了怎樣分配有限的煉丹爐。
雖然他聽不懂那些高深的特征增廣、小樣本學(xué)習(xí)、時間序列預(yù)測、給數(shù)據(jù)驅(qū)動模型添加物理約束等理論。但作為一個通識課上學(xué)了9個學(xué)時,就被要求一個暑假里手?jǐn)]一個圖像識別算法的高材生,他有他自己的想法。
他要用強(qiáng)化學(xué)習(xí)。
“對于強(qiáng)化學(xué)習(xí)而言,我們的樣本太少了?!蹦睦锒家獡揭荒_的鄭K一如既往地苦著臉說。
“少就少唄,又不是不能用。再說了,我們不是正在用老鼠造模嗎?造完了樣本就多了。”盧赫不以為然。
“具體思路呢?”鄭K憂心忡忡地問。
“跟你們一樣。特征是某時間點(diǎn)的基因組,標(biāo)簽是未來的突變位點(diǎn),然后讓單堿基編輯的載著相應(yīng)向?qū)NA的CRISPR系統(tǒng)在那里等著,一旦突變了,就立刻給修復(fù)。把病扼殺在搖籃里。
非要說有什么不同,第一,我這是黑箱,只能發(fā)揮作用,卻不知道怎么發(fā)揮作用;第二,我這基本算是端到端的、全自動的,人工干預(yù)只在定期查基因組和設(shè)計(jì)CRISPR系統(tǒng),這部分工作未來也有希望自動化。
功過相抵,中規(guī)中矩?!?p> 散會后,盧赫坐到電腦跟前,摩拳擦掌。
雖然不是專業(yè)人士,但一直跟進(jìn)這方面進(jìn)展的他,始終覺得那些在數(shù)年間如雨后春筍般涌現(xiàn)出來的大幾十種方法里,強(qiáng)化學(xué)習(xí)最有前途。
因?yàn)檫@是最接近人類本能學(xué)習(xí)方式的一種。
它的原理也很簡單,就是讓懵懂的小人工智障在環(huán)境里學(xué)習(xí),它的每個動作都對應(yīng)一個獎勵或者懲罰。
就像還在蹣跚學(xué)步的小時候的我們一樣,我們看到了火,好奇心趨勢我們走近,我們感受到了溫暖,獎勵加一;手賤去摸了一下被燙到,懲罰加一。
于是,聰明的我們就會知道,火很暖和但不能靠得太近。
只不過與人不同得是,小人工智障無法一次就學(xué)會,而是需要大量數(shù)據(jù)去支撐它在環(huán)境里反復(fù)探索,直到把自己訓(xùn)練成人工智能。
如果用玩超級瑪麗來打比方,小人工智障在游戲的第一幀獲得初始狀態(tài);
在此基礎(chǔ)上,我們可以逼迫它往前走一步,不論前方是不是有蘑菇怪。這樣它會主動做出第一個行動。
這時,它所處的環(huán)境發(fā)生了變化,獲得了新的狀態(tài);
同時,根據(jù)它死沒死,環(huán)境會給它一個獎勵或懲罰。
如此循環(huán)下去,便得到了一個由狀態(tài)、行動和獎勵組成的序列。小人工智障的目標(biāo)就是調(diào)整自己的狀態(tài)和行動,以使獎勵的期望值最大。
如果訓(xùn)練的順利,它便有望進(jìn)化為一命通關(guān)的人工智能外掛。
不同時間點(diǎn)的海晝天的基因組就是環(huán)境,逼迫小人工智障跑到基因組的某一個位置上改一個或多個堿基就是行動,根據(jù)改了以后海晝天得不得病來施加獎勵和懲罰。
如果順利的話,訓(xùn)練成功的人工智能便可以精準(zhǔn)地找到潛在突變區(qū),為CRISPR系統(tǒng)的設(shè)計(jì)指引方向。
不過,凡事總有意外。
人在制定規(guī)則的時候總有疏漏,可能會讓小人工智障憑借逆天的腦回路鉆空子。因?yàn)樗鼈冇袩o限條生命,可以快速試錯。
一些煉丹者寫出的地獄笑話廣為流傳:
一個機(jī)械手被要求把木塊挪到桌子的指定地點(diǎn),小人工智障的解法是挪桌子;
要求物體高速運(yùn)動,于是小人工智障把自己設(shè)計(jì)得特別高,依靠不斷跌倒獲得速度;
生物生存需要消耗能量,但是繁育后代不消耗,于是小人工智障演化出來的生活方式就是不斷生育后代,然后把后代吃掉;
要求自動修復(fù)文檔,如果輸出的結(jié)果和目標(biāo)文檔的內(nèi)容一致就被認(rèn)為是修好了。于是小人工智障把原文檔刪掉了,這樣它的內(nèi)容為空,然后再輸出一個空的結(jié)果就和它一致了。
又或者要求玩俄羅斯方塊不輸,于是小人工智障一直暫停游戲,不贏,但永遠(yuǎn)不輸。
。。。。。。
想到這里,他不禁笑出了聲?;诂F(xiàn)有數(shù)據(jù)的訓(xùn)練程序很快就寫好了,他很期待這個漏風(fēng)的煉丹爐的表現(xiàn)。
步伐輕快地回到住處,他撈起塑料瓶做成的簡易噴壺,給種在臉盆里的干枯冬青木仔仔細(xì)細(xì)地噴了一圈水,顯得格外悠閑。
煉丹什么的,比得就是心態(tài)。如果爐子爆炸之前自己先不耐煩了,那就是輸了。
七七四十九天而已,搖著扇子窩在一旁等著,時間很快就會過去的。
非奇異矩陣
今天打賞和投票的新老朋友們,給你們鞠躬了┏○。