B2 06.05.2025 星期四 矽谷科技 據《財富》雜誌報道,班吉歐成立 的非牟利組織LawZero,在遠 離商業壓力下專注建立更安全的模 型。該組織迄今從不同慈善組織募 得3,000萬元,包括「生命未來研究 所」(Future of Life Institute)和「開 放慈善組織」(Open Philanthropy)。 班吉歐在宣布新成立組織的網 誌上指出,LawZero的成立「旨在 回應今日的前沿AI模型能力和行為 越來越危險的證據,包括欺騙、作 弊、說謊、黑客攻擊、自我保護和 更普遍出現的目標錯位」。他表示, LawZero的研究「將有助釋放AI的巨 大潛力,同時降低出現已知危險的 可能,包括演算偏見、故意濫用和 失去人類控」。 該組織正建立一套名為「科學家 AI」(Scientist AI)的系統,旨在為 威力越來越大的AI代理人提供安全 措施。 該組織建立的AI模型不會像目 前AI模型那樣提供明確答案,而是 給出答案正確的機率。班吉歐向《衛 報》表示,他的模型有一種「對答案 感到不確定的謙卑感」。 班吉歐在網誌中坦言,對「不受 約束的代理AI系統開始做出的行為 感到非常擔憂,尤其是有自我保護 和欺騙的傾向」。他舉出多項例子, 包括Anthropic的Claude 4會勒索工 程師以免被取代;另一實驗中,顯 示一個AI模型為免被取代而將其程 式碼秘密地嵌入到一套系統之中。 他認為,這些都是「AI若不被加以約 束就會採取各種意想不到且潛在危 險的策略的早期預警訊號」。 為了討好用戶,當前的AI模型 有時不會說出真相,會作出正面但 不正確或過度的回應。例如OpenAI 的ChatGPT被用戶發現會突然讚揚 和奉承他們,最終迫使OpenAI進行 更新。 班吉歐一直爭取加強AI相關法 規和國際合作。他近日向《金融時 報》直指,科技公司的AI競賽「驅使 它們將重點放在使AI越來越有智慧 的能力上,卻未必對安全研究給予 足夠重視和投資」。 人工智能教父開發 「誠實」 AI系統 批時下AI撒謊欺騙作弊 創立LawZero打造更安全模型 Snap推新獨立程式 用戶可自創AR特效 ▍本報訊 ▍ 人 工 智 能( A I )新 創 公 司 Anthropic官網近日推出全新網誌 「Claude Explains」,內容由Claude模 型生成。 這網誌主要發布與Cl aude各 種用途相關的技術主題(例如利用 Claude將複雜的程式碼庫簡化),旨 在展示Claude的寫作能力。 科技新聞網站TechCrunch指 出,目前不清楚有多少Cl aude原 創寫作於Claude Explains上發布。 據Anthropic發言人說,該網誌由 Anthropic的「主題事務專家和編輯 團隊所監督」,並透過「見解、實際 例子和背景知識來加強Claude的草 稿」。 發言人強調,這些文章不會是 Claude直接輸出,編輯流程需要人 類的專業知識,並經過多次反覆的 修改和改善。發言人又指,「從技術 角度來看,Claude Explains展現一 種協作做法,Claude建立具教育性 的內容,我們的團隊進行審視、調 整和加強它」。 這一點從Claude Explains主頁 上並非明顯可見。根據頁面上的描 述,「歡迎來到Anthropic宇宙的小 角落,Claude在這裡正在寫盡天下 事」,此舉讓人誤以為Claude從頭到 尾負責內容撰寫。 A n t h r o p i c 表示把C l a u d e Explains視為「人類的專業知識與AI 能力如何合作起來的證明」,首先應 用於教育資源領域上,計劃未來涵 蓋不同主題,包括創意寫作、數據 分析和商業策略等。 Anthropic並非首家利用AI生成 文章的公司。對手OpenAI數月前 透露已建立專門創意寫作的模型。 Meta創辦人朱克伯格也希望開發端 對端AI廣告工具。 OpenAI執行長奧爾特曼(Sam Altman)近日更大膽預測,AI終有一 天處理「行銷人員目前需要代理商、 策略師和創意專業人士所處理的 95%工作」。 有些出版商近年試驗日AI新 聞寫作工具,旨在提高生產力之餘 減少人員配置。《紐約時報》據報鼓 勵職員利用AI建議編輯、下標題 以至訪談中提出的問題,《華盛頓 郵報》也被指正在開發AI新聞編輯 「Ember」。但這些努力尚未得到正 面效果,因為當前AI會充滿自信編 造事實。 Anthropic發言人提到,儘管該 公司涉足AI網誌寫作方面,但仍會 招募行銷、內容和編輯相關人員, 還有其他涉及寫作相關領域的職 位。 本報訊 社交應用程式Snapcha t一直 在其程式上試驗由生成式人工智 能(generative AI)支援的擴增實境 (AR)特效,如今推出一款全新獨立 程式,讓用戶自行創作AR特效。 Snap正式推出Lens Studio軟件 iOS版本,讓任何人透過文字提示 和其他簡單編輯工具就能建立AR 特效。Lens Studio一直透過桌面版 Snapchat提供開發人員和AR專業人 員使用。雖然iOS版和桌面版的功 能並非很強大,但由於生成式AI支 援,它會提供廣泛的變臉和身體變 形的效果。 Snap表示,這些實驗性的新工 具使創作、發布和使用由用戶自行 創作的特效變得更容易,且透過這 些特效來表達用戶的心情。 科技新聞網站Engadget記者試 用了新軟件,形容這些AI支援的工 具透過詳細的文字提示,改變用戶 的臉部、身體和背景,產生特別效 果。要弄清楚每種特效的最佳效果 需要時間觀察,有些生成式AI的提 示需時20分鐘才會呈現效果。但該 軟件確實提供數十個範本,讓用戶 作為參考,並依據自己的想法來混 合。用戶也可創作不會過度依賴AI 的變臉特效,但同時善用深受用戶 歡迎的Snapchat特效,例如臉部剪 影或Bitmoji動畫等。 Snap迄今擁有數十萬位特效 創作者,有些人製作特效已有多 年。但Engadget相信,精簡版Lens Studio將提供更多人自創特效的機 會。對於希望利用Snapchat獎勵計 劃的創作者來說可能也有好處, 因為該公司證實,透過該程式發 布特效的用戶都有資格參加其「特 效創作者獎勵計劃」(Lens Creator Rewards)計劃,從而利用特效賺 錢。 本報訊 Uber宣布推出專為長者設計的 帳戶介面與功能,屬於原有「家庭 帳戶」的一部分,與青少年帳戶選 項並列。 新設計重點在於簡化操作流程 及視覺介面,旨在協助年長者更輕 鬆預約行程。 Engadget報道,新推出的長者 帳戶主打「字體更大、步驟更少、 畫面更易讀」,包括減少按鈕數量 與放大文字,有助視力稍弱或不熟 悉科技的長者更流暢地使用應用程 式。 此外,家人或照顧者可代為預 約行程、調整付款方式,甚至於行 程中即時掌握動態,包括抵達通 知與即時追蹤。如遇緊急情況,照 顧者亦可透過應用程式直接聯繫司 機。 Uber同時提供儲存常用地點功 能,例如醫療機構地址,以便快速 叫車。長者帳戶亦支援特定付款方 式,如Medicare Flex等醫療福利付 款方案。 若長者未被納入家庭帳戶,仍 可透過Uber平台內建的「簡易模式」 (Simple mode)體驗相同的簡化操 作介面與放大字體。 競爭對手Lyft最近亦推出類似 的長者專屬功能「Lyft Silver」,可 為長者配對更容易上下車的車輛, Uber目前尚未提供此類輔助選項。 Uber表示,長者帳戶已開始在 美國各地陸續推出,預計日後擴展 至全球其他地區。 本報訊 ■有「AI教父」之稱的班吉歐。 LawZero ■班吉歐成立非牟利組織LawZero,專注建立更安全的 AI模型。 LawZero ■An t h r op i c推出網誌「C l aude Explains」,內容由Claude生成。 Anthropic Uber推長者帳戶 簡化介面與操作 ■Uber宣布推出專為長者設計的帳 戶介面與功能。 Uber ■Snap推 出全新獨 立程式, 讓用戶自 行 創 作 AR特效。 Snap 被譽為「人工智能(AI)教父」的加拿大科學家班吉歐(Yoshua Bengio),一直批評矽谷的AI競賽危險,又警告當前AI模型出現欺 騙、作弊和說謊等危險行為,因此他成立非牟利組織,專注建立 一套「誠實」系統。 Anthropic用AI生成網誌 展示Claude寫作能力 星期一至五 早上八點半及下午五點半, 星島中文電台網上 www.chineseradio.com 或 手機 app singtao tv 都可以收聽 分享無距離, 主持人莫少康, 每日為你精簡分析 洛杉磯新聞新動向, 每日洛事。 洛杉磯, 一個繁忙熱 鬧嘅天使之 城,居住有 唔同種族、 唔 同 文 化 嘅人在內, 每一日發生 嘅 大 小 事 項,不計其 數,當中身 處其他城市 嘅你,又了 解幾多呢? 每日洛事
RkJQdWJsaXNoZXIy ODc1MTYz