B2 06.13.2025 星期五 矽谷科技 哈佛大學12日向AI研究員釋出一 批近100萬份的藏書,部份書 籍可追溯至15世紀,涉及254種語 言。這些AI研究員很快也能接觸全 美最大之一的波士頓公共圖書館的 大量舊報紙和政府文件藏品。 當前科技公司正因未經同意盜 用作品訓練AI聊天機器人,而與在 生的小說家、視覺藝術家和其他藝 術創作者展開司法訴訟戰,能夠打 開擁有數百年歷史的古籍書庫,可 謂一個數據寶藏。 微軟公司副法律顧問戴維斯 (Burton Davis)說︰「從公共領域資 料開始是一個謹慎決定,因為目前 與仍有版權的內容相比,那些公共 領域資料的爭議比較少。」 戴維斯稱,圖書館還保存了「大 量有趣文化、歷史和語言數據」,這 些資料在AI聊天機器人所學習的數 十年網上評論中缺失。對於數據耗 盡的憂慮,也促使AI開發人員轉向 使用機器人生成且品質較低的「人工 數據」。 在微軟和AI公司OpenAI的「無 限捐贈」支持下,哈佛大學的「機構 數據倡議計劃」,正與全球各圖書館 和博物館合作,將其歷史藏品能夠 供AI培訓,同時裨益其服務的社區。 哈佛最新釋出的「機構書籍1.0」 (Institutional Books 1.0)數據集, 包括3億9400萬多份已掃描文件。 其中最早的作品之一來自15世紀, 一名韓裔畫家對花木栽培心得的親 筆信。館藏最集中的作品來自19世 紀,涉及文學、哲學、法學和農業 等主題,歷經一代又一代的圖書館 管理員悉心保存和整理。 對於嘗試提升AI準確度和可靠 度的AI開發人員來說,這是一個天 大的福音。「機構數據倡議計劃」主 任萊珀特(Greg Leppert)指出,很多 用於訓練AI的數據並非來自原始來 源,且這些館藏「可追溯到實際收藏 這些書籍的機構所掃描的紙本」。 哈佛圖書館早於2006年開始為 其藏品電子化,協助谷歌建立一個 2,000多萬本書籍的可搜尋網上圖書 館。 圖書館藏書 成訓練AI數據庫 哈佛大學「機構數據倡議計劃」與全球圖書館博物館合作 微軟AI分享屏幕 Edge搜尋瀏覽記錄 ▍美聯社麻省劍橋電 ▍ 谷歌最近為智能家居操控程式 Home增加多項新功能,其中大多數目 前已在公開預覽版中開放使用。 科技網站The Verge稱,最重要的 新功能是,無論擁有哪款Goog l e TV 產品,Ne s t Cams都將支援子母畫面 (Picture-in-Picture)。這項功能顧名思 義,可同時查看Nest Cam拍攝的所有畫 面,顯示在電視屏幕的某個區域。 谷歌在2025年的任何發布似乎都離 不開AI,果不其然,Gemini 將擁有比 以往更廣泛的智能居家控制功能,用 戶可以透過連接的喇叭廣播語音,或在 Gemini程式中輸入特定查詢詞語,來 搜尋攝影機的影像紀錄。連結到谷歌 Home程式的任何攝影機,將可以透過 在裝置螢幕的左側或右側輕點兩下,在 片段中以秒為單位快轉或倒轉,更輕鬆 地找到想查看的特定時刻。 一些新的變化聚焦於Home客制 化,包括自動化功能的改進,讓用戶在 程式中以更少的步驟完成自動化功能, 和讓自動化設定更具體,比如用程式中 的存在感應(presence sensing)功能,用 手機位置以及某些谷歌Nest產品的Soli感 測器,來確定是否有人在家。 空氣監測設備Nest Protect的煙霧和 一氧化碳狀態,也將可在Home程式中 查看,不再需要額外使用獨立的Nest程 式。谷歌稱,用戶將能在Home中接收 關鍵安全警報和預警通知,並執行必要 的安全檢查以及將警報靜音。 Home程式還擴展對與第三方Matter 標準相容的智能鎖的支持,提供眾多可 自訂的設定,包括管理訪客、編輯密 碼、接收鎖定/解鎖通知等等。 本報訊 微軟周四推出適用於視窗 Windows的人工智能(AI)助理新 功能Copilot Vision,讓用戶共享 電腦屏幕或應用程序,使Copilot 可以「看到」用戶屏幕,指導使用 各種軟件或分析正在查看的照片 和網頁等。與此同時,微軟網絡 瀏覽器Edge新增AI功能,可搜尋 瀏覽記錄。 Copi lot團隊在官方網誌上 稱,啟用該功能後,「Cop i l o t Vision 可以看到您所看到的內容 並即時與您對話,」,形容「它就 像您的第二雙眼睛,能夠分析內 容、在您迷茫時提供幫助、提供 見解並隨時解答您的疑問。」 微軟今年稍早首次在視窗系 統中測試Copilot Vision,現在免 費向美國的視窗10和11用戶推 出,不需要訂閱Copilot Pro。 另外,Edge瀏覽器新的「增 強搜尋」功能可讓用戶在瀏覽器 歷史紀錄中找到所要的網站,即 便使用短語、同義詞,甚或拼寫 錯誤的詞語,只要與尋找過的網 站相似,就會顯示出來。 這項AI驅動的歷史紀錄搜尋 功能,已於上周開始出現在微軟 Edge瀏覽器的Beta版本中。微軟 強調「啟用此功能後,你造訪過 的網站將顯示在增強歷史紀錄搜 尋結果中。裝置上的模型會使用 你的資料進行訓練,並且這些資 料永遠不會離開裝置,也不會發 送給微軟。」 除了引入AI驅動的瀏覽紀錄 搜尋功能外,微軟還在Edge中增 添一個媒體控制中心,讓使用者 可以控制來自網站的多個媒體來 源。 本報綜合報道 網站維基百科(Wikipedia)本月稍 早宣布推出一項實驗,使用人工智能 (AI)為其平台上的文章進行摘要,但 據報由於編輯強烈反對,維基百科只好 暫停實驗。 科技新聞網站404 Media報道, 這項實驗讓安裝維基百科擴充功能的 用戶選擇參與。由AI生成的摘要將出 現在每篇維基百科文章的頂端,並有 「unverified」(未經驗證)的黃色標籤, 用戶必須點擊展開才能閱讀摘要。 但據報有編輯們馬上批評這項實 驗,擔心恐破壞維基百科的公信力。其 實他們並非過慮,因為AI生成的摘要 往往出現錯誤,這是源於AI容易產生 「幻覺」捏造事實。彭博社等正在採取同 類實驗的新聞媒體有時被迫做出修正, 甚至將實驗規模縮減。 維基百科暫停實驗,但該平台曾表 明,仍有興趣推出AI生成摘要,希望 用於擴大可及性等用途。 本報訊 ■圖書館館藏將成為訓練AI的數據寶庫。 美聯社 ■哈佛大學「機構數據倡議計劃」主任萊珀特在圖書館留影。 美聯社 ■谷歌Home程式推出更新,用戶操控 智能家居裝置更便利。 谷歌 ■簡便各裝置自動 化的設定。 谷歌 AI摘要惹反對聲浪 維基 科暫停實驗 ■維基百科暫停AI摘要的實驗。 美聯社資料圖片 網路上一切言論都只是教 授人工智能(AI)人性知識的開 端,現在科技公司開始挖掘一 個更古老的知識寶庫,那就是 圖書館的藏書。 谷歌Home程式更新 便利智能家居操控 ■微軟AI助理增加新功能Copilot Vision。 微軟
RkJQdWJsaXNoZXIy ODc1MTYz