圖片來源:princeea網站
如果AI系統作出了正確預測,但卻以完全不同的方式解釋其得出的這些結果,會發生什么?DFKI數據科學團隊介紹了“X-hacking”給AI可信度帶來結構性風險的研究成果。
X-hacking一詞源于統計學中的P-hacking。所謂P-hacking指的是研究人員可通過一些數據操作技巧,在統計學上得出一個有顯著意義的結果,即使這個結果實際上并無意義。這相當于一種數據篡改,可能會導致發布假陽性結果。
相應的X-hacking描述了兩種核心機制:一是Cherry-picking,即從眾多同樣優秀的模型中,精心挑選出解釋能力最強、最能支持預期結果的模型;二是定向搜索,AutoML系統不僅能優化預測性能,還能精準地找到具有特定解釋模式的模型。但這里面存在的風險往往被低估。
即使模型得出的結果幾乎相同,所謂的特征重要性也可能存在巨大差異。這在醫學研究或社會科學等應用領域尤為敏感,因為在這些領域,可解釋的模型通常構成關鍵決策的基礎。
AutoML代表了開發、選擇和優化機器學習模型的自動化流程。軟件工具接管了許多以前只有經驗豐富的機器學習工程師才能完成的任務,例如選擇合適的模型架構、數據預處理和超參數優化等。在醫學、工業或社會研究等數據密集型領域,AutoML有望實現更快的開發速度、更低的進入門檻和可重復的結果。
然而,這種自動化使得人們難以理解模型決策的制定方式,這是可解釋AI的一個關鍵問題。因此,DFKI研究團隊建議,使用AutoML的學科應該意識到方法的風險,而不僅僅只是信任軟件。
關鍵詞:
凡注有"環球傳媒網"或電頭為"環球傳媒網"的稿件,均為環球傳媒網獨家版權所有,未經許可不得轉載或鏡像;授權轉載必須注明來源為"環球傳媒網",并保留"環球傳媒網"的電頭。
- 北京防汛一級應急響應 遇極端情況地鐵將立即封站區段停運 新消息
- 人民日報刊文評陳佩斯喜劇藝術:一位喜劇人的藝術探索和理論自覺 每日快看
- 探訪全球最大塔機工廠,中聯重科:海外市場成新增長引擎,占比六成|最新消息
- 國家發展改革委緊急安排5000萬元支持河北暴雨洪澇災害災后應急恢復
- “十四五”以來稅務部門共查處違法納稅人6.21萬戶,挽回各類稅款損失5710億
- 6月中國規上工業企業利潤同比降幅收窄 每日資訊
- 微動態丨水淋淋的是什么意思?水淋淋的是什么梗?
- 《海南歷史文化名人叢書》全系列100種面世首發 焦點要聞
- 世運會探館Vlog:“順勢”建成的水上項目場地
- 每日熱訊!三伏天來了,這些養生誤區要避免
資訊
焦點
- 入股不虧是什么意思?入股不虧是什么梗?
- 浙江長興:外賣騎手組隊為高齡老人免費送餐到家
- 播報:稅務總局:從今年個稅匯算看,超1億納稅人依法申請退稅1300多億,700多萬納稅人申報補稅480余億
- 即時:事關3800萬貨車司機!交通運輸部部署保障司機合理勞動報酬
- 熱議:“竹夢”抵達成都熊貓基地 成龍攜火炬登頂“筍子塔”
- 全國東西南北中羽毛球大賽雞西大區賽開賽 頭條焦點
- 甘肅魏晉畫像磚特展長沙開幕 “磚”看古人生活日常|熱點
- 你已超過99%的人!助力世運火炬傳遞沒你不行
- 新華社權威速覽·非凡“十四五”|減輕看病就醫負擔,醫保支付這樣發力!-每日熱議
- 拼盤動畫片如何擺脫“番劇感”? 從《聊齋:蘭若寺》的6段故事說起