<abbr id="kc8ii"><menu id="kc8ii"></menu></abbr>
  • <input id="kc8ii"><tbody id="kc8ii"></tbody></input><table id="kc8ii"><source id="kc8ii"></source></table><kbd id="kc8ii"></kbd>
    <center id="kc8ii"><table id="kc8ii"></table></center>
  • <input id="kc8ii"></input>
    <abbr id="kc8ii"></abbr>
  • <abbr id="kc8ii"></abbr>
  • <center id="kc8ii"><table id="kc8ii"></table></center>
    <abbr id="kc8ii"></abbr>
    你的位置:首頁 > 互連技術(shù) > 正文

    人工智能限制與否:‘堂吉訶德’系統(tǒng)通過講故事來教機(jī)器人價值觀

    發(fā)布時間:2016-02-19 責(zé)任編輯:susan

    【導(dǎo)讀】機(jī)器人是否存在不道德的行為或者是選擇傷害人類呢?人工智能(AI)的快速發(fā)展使我們越發(fā)擔(dān)憂。“堂吉訶德”系統(tǒng)通過訓(xùn)練機(jī)器人閱讀故事的方法來教導(dǎo)它們“價值校準(zhǔn)”,讓機(jī)器人讀故事來學(xué)習(xí)事件可以接受的后果,并理解要在人類社會中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。
     
    一些人呼吁禁止機(jī)器人技術(shù)的研究;其他人則呼吁更多地研究理解怎樣對人工智能進(jìn)行限制。 但是如果沒有成為人類的“用戶說明書”,機(jī)器人又怎樣來學(xué)習(xí)倫理行為呢?
      
    美國佐治亞理工學(xué)院、交互計算分院的研究人員Mark Riedl 和 Brent Harrison 認(rèn)為,答案在于“堂吉訶德”系統(tǒng)— — 在亞利桑那州鳳凰城(2016 年2 月 12-17日)的AAAI(美國人工智能學(xué)會)第16次會議上公布。“堂吉訶德”系統(tǒng)通過訓(xùn)練機(jī)器人閱讀故事的方法來教導(dǎo)它們“價值校準(zhǔn)”,讓機(jī)器人讀故事來學(xué)習(xí)事件可以接受的后果,并理解要在人類社會中獲得成功應(yīng)當(dāng)怎樣表現(xiàn)。
      
    “不同文化背景里的故事集,用寓言、小說和其他文學(xué)形式的正確和不正確行為示例,來教導(dǎo)孩子做出社會認(rèn)可的舉止行為。” Riedl說,他是副教授和娛樂智能實驗室主任。“我們認(rèn)為機(jī)器人對故事的理解可以讓它們減少精神病患者出現(xiàn)的行為,并且強(qiáng)化它們“不要傷人”的選擇,同時達(dá)到期望的任務(wù)目標(biāo)。
     
     
    配圖說明:研究學(xué)者 Mark Riedl 和 Brent Harrison 的“堂吉訶德”系統(tǒng)教導(dǎo)機(jī)器人在與人互動時候表現(xiàn)為正派角色,并且這是把倫理價值觀系統(tǒng)構(gòu)建進(jìn)入到新型人工智能的巨大努力的一部分。
      
     
    “堂吉訶德”系統(tǒng)是一種通過對社交中恰當(dāng)行為給予獎勵,使得人工智能的目標(biāo)與人類價值觀一致的一種校準(zhǔn)方法。它是建立在Riedl教授之前的一個研究——“天方夜譚”系統(tǒng),的基礎(chǔ)上的。“天方夜譚”系統(tǒng)展示了人工智能如何通過在互聯(lián)網(wǎng)上面的眾包模式故事情節(jié),來匯集得出正確的行動后果。
     
    “天方夜譚”系統(tǒng)可以學(xué)習(xí)什么是正常的或者正確的情節(jié)圖譜。然后它把數(shù)據(jù)結(jié)構(gòu)傳遞給“堂吉訶德”,“堂吉訶德”再將其轉(zhuǎn)換成“獎勵信號”——在反復(fù)試錯學(xué)習(xí)過程中強(qiáng)化特定的行為并且懲罰其他的行為。大體上,“堂吉訶德”可以學(xué)習(xí)到,當(dāng)它表現(xiàn)為故事里面的正派角色而不是任性而為或是表現(xiàn)為反派角色的時候,它將會獲得獎勵。
      
    例如,某個機(jī)器人的任務(wù)是盡可能快地為某個人拿到一個藥方,機(jī)器人可以:a)搶劫藥房,奪取藥物,并跑走; b) 與藥劑師有禮貌地進(jìn)行交互,或 c) 排隊等候。如果沒有“價值校準(zhǔn)”和積極強(qiáng)化機(jī)制,這個機(jī)器人可能會認(rèn)為搶劫是最快和最便宜的方式,來完成其任務(wù)。通過“堂吉訶德”系統(tǒng)的“價值校準(zhǔn)”,這個機(jī)器人將因為耐心排隊等候并且付費買藥方而獲得獎勵。
      
     
    Riedl 和 Harrison 在他們的研究中證明了,在某個給定的情境中, 價值校準(zhǔn)獎勵信號怎樣可以產(chǎn)生并展開所有可能的步驟,引導(dǎo)機(jī)器人進(jìn)入一個情節(jié)軌道樹,然后這將被機(jī)器人用來形成“情節(jié)選擇”(類似我們很多人可能參與過的一種可以自由選擇后續(xù)情節(jié)發(fā)展的小說),并且根據(jù)它的選擇,機(jī)器人將會受到獎勵或者懲罰。
      
    如果機(jī)器人有一個限定性的、并且需要它和人類交流才能達(dá)成的任務(wù)目標(biāo),那么“堂吉訶德”方法是最佳的,并且它是人工智能朝向普遍性道德推理能力的最原始、初級的一步。Riedl 如此說。
      
    “我們相信,人工智能必須植入特定的文化從而適應(yīng)特定社會環(huán)境的價值觀念,并且通過這樣做,它將努力避免不當(dāng)?shù)男袨榕e止,”他補(bǔ)充說,“賦予機(jī)器人閱讀并理解故事的能力,可能是在缺乏成為人類的用戶說明書情況下,最好的權(quán)宜之計。”
    特別推薦
    技術(shù)文章更多>>
    技術(shù)白皮書下載更多>>
    熱門搜索
    ?

    關(guān)閉

    ?

    關(guān)閉

    亚洲中文字幕无码专区| 最近最新中文字幕| 日本中文字幕在线不卡高清| 人妻少妇无码精品视频区 | AA区一区二区三无码精片| 中文人妻av高清一区二区 | 最近中文字幕大全免费视频 | 日韩爆乳一区二区无码| 亚洲国产精彩中文乱码AV| 亚洲成AV人在线观看天堂无码 | 无码国产伦一区二区三区视频| 中文无码人妻有码人妻中文字幕| 最新国产AV无码专区亚洲| 亚洲国产精品无码久久九九| 极品粉嫩嫩模大尺度无码视频| 日无码在线观看| 亚洲av无码片vr一区二区三区| 最好看2019高清中文字幕| 精品亚洲A∨无码一区二区三区| 日本欧美亚洲中文| 狠狠躁天天躁无码中文字幕| 中文字幕51日韩视频| 午夜无码视频一区二区三区| 亚洲精品无码久久一线| 中文字幕在线资源| 中文字幕AV一区中文字幕天堂| 日韩人妻无码精品久久免费一| 欧美日韩中文字幕在线| 亚洲 欧美 国产 日韩 中文字幕| 久久精品无码专区免费东京热 | 丰满人妻AV无码一区二区三区| 国产AV无码专区亚洲AV漫画| 最近2019好看的中文字幕| 最新中文字幕av无码专区| 成人无码精品1区2区3区免费看| 久久亚洲精品成人无码网站| 无码AV中文字幕久久专区| 午夜亚洲av永久无码精品| 国产成人精品无码一区二区 | 中文字幕精品亚洲无线码一区应用 | 国产在线精品无码二区|