05-22-2025星島日報(洛杉磯版)

B2 05.22.2025 星期四 矽谷科技 據科技網站The Verge報道,使用Flow, 你可以透過如文字轉影片提示或素材轉 影片提示,來製作最長八秒的AI生成影片。 素材轉影片基本上是上傳幾張圖片,再搭配 提示文字,幫助模型理解你想要的內容。然 後,使用Flow的場景建構器工具,將多個片 段拼接在一起。 Flow似乎有點像影片剪輯應用程式,但 目的是專門用來製作AI生成影片。谷歌實驗 室(Google Labs)的產品經理伊利奇(Thomas Iljic)展示了Flow的一些實際應用範例,如一 部動畫風格的影片:「攝影機」先拉遠,揭示 原來畫面是在電視上播放,接著畫面再次拉 遠,顯示出電視所在的房間。然後,「攝影 機」慢慢飛出窗外,看到一輛卡車駛過。 影片整體看起來相當流暢,伊利奇稱, Flow的理念並不在於製作長影片,而是為了 幫助電影製作人快速將他們的想法紀錄下來。 對於谷歌在I/O大會上發布的新模型,谷 歌DeepMind創意主管洛蘭(Matthieu Lorrain) 表示,Veo 3將擁有更佳的畫質,並且更容易 下提示,同時生成影片和聲音(包括對話)。 它在理解較長的提示方面也更強,能正確處 理在提示中描述的一系列事件。 Veo 2 將提供如鏡頭控制和物件移除等工 具。谷歌新的圖像生成模型Imagen 4的品質 有所提升,不僅可以導出更多格式,還有更 擅長生成可讀的文字,而不是這些圖像中經 常出現的AI亂碼。 Flow已於近日在美國推出,開放給訂閱 谷歌全新的Google AI Pro和Google AI Ultra 方案的用戶。谷歌稱AI Pro提供Flow的主要功 能,每月可生成100次創作,而AI Ultra 提供 更高的使用上限,並可優先體驗支援原生音 訊生成的Veo 3模型。 谷歌連推多款AI生成新模型 Flow創作8秒視頻 Veo3影片含音頻 Imagen 4圖內文字拼寫正確 互聯網公路旅行 千人同遊樂逍遙 ▍本報訊 ▍ 谷歌本周在2025年I/O 大會上宣布重新 投入智能眼鏡市場,與多家公司合作開發建 立於Android XR平台的智能眼鏡等隨身裝 置,其聯合創始人布林(Sergey Brin)同日活 動上公開承認,當年推動谷歌眼鏡(Google Glass)時「犯了很多錯誤」。 這場訪談由著名播客「Big Technology Podcast」主持人坎特羅維茨(Alex Kantrowitz) 主持,事先宣布的受訪者是谷歌A I部門 DeepMind執行長哈薩比斯(Demis Hassabis), 布林的現身則是出人意料的驚喜插曲。 布林憶述,當年「對消費性電子產品的供 應鏈一無所知」,也不了解要以合理價格製 造智能眼鏡有多困難。對於這次谷歌重新出 發,他強調對智能眼鏡這種產品形式深具信 心,這次「有優秀的合作夥伴幫助我們打造這 款產品」。 谷歌最新的智能眼鏡開發計劃,由 DeepMind的Project Astra提供AI支援,能夠 執行即時翻譯、提供導航指引,並處理一般 的AI查詢。谷歌將與一系列合作夥伴攜手合 作,包括三星和Xreal等公司。谷歌還承諾投 資高達1.5億元與時尚眼鏡品牌Warby Parker 建立合作關係,並對該公司進行股權投資, 以支持谷歌的智能眼鏡開發計劃。 布林表示,與經驗豐富的眼鏡和電子產 品製造商合作,有助解決生產智能眼鏡所涉 及的一些供應鏈問題。他還指出,生成式AI 的出現,讓智能眼鏡的功能比起當年Google Glass推出時,變得「更具實際可行性」。本報訊 你聽著緬因州鮑登學院( B o w d o i n College)的廣播電台,夾雜著周圍的汽車喇 叭聲,但你不在緬因州,也不在車裡,而是 在電腦前玩一個大型多人在線公路旅行遊戲 「Internet Roadtrip」。 遊戲開發者阿加瓦爾(Neal Agarwal)稱之 為「公路旅行模擬器」,每隔10秒,觀眾就會 在谷歌街景上投票決定「汽車」的行駛方向, 也可以投票決定按喇叭或換廣播電台。 科技網站Te chCr uch指出,I n t e r ne t Roadtrip讓人想起10多年前的標誌性串流遊 戲Twitch Plays Pokmon,也是讓觀眾投票 決定按下哪個按鈕作為遊戲的一部分。但 Internet Roadtrip遠沒有那麼混亂——因為 一次只有大約1000人在玩,而且因為有了比 過去更好的組織工具,參與者在通訊平台 Discord交流。 這場虛擬公路之旅進展緩慢,「汽車」以 比走路還慢的速度行駛,版主需要向新來者 解釋,從緬因州開車去拉斯維加斯是沒有意 義的,因為可能需要近10個月的時間,去阿 拉斯加也一樣,因為受困於「谷歌街景的工 作原理是拍攝多張照片並將它們放在一起。 在通往阿拉斯加的一些道路上,圖片上有空 白,如果走這些道路,我們會被困在那裡。」 與GeoGuessr等其他基於街景的遊戲不 同,Internet Roadtrip沒有目標。遊戲參與者 都明白,目的地並不是目的——它是一種快 樂,一種在欣賞緬因州風景優美的鄉間小路 的同時,與一千個陌生人在網上自發地聽著 一所文科大學廣播的快樂。 本報訊 電商平台亞馬遜21日宣布,正在指定產 品頁面上測試由人工智能(AI)生成的語音版 產品摘要。這些語音摘要由亞馬遜所稱的「AI 購物專家」讀出,會討論重要的產品功能、客 戶評價和來自網上的相關資訊。 只要從亞馬遜購物應用程式中點擊「聆聽 精彩內容」(Hear the highlights)按鈕,就能 聽到AI生成的產品摘要。亞馬遜表示,該測 試會針對一般需要考慮才會購買的產品,旨 在幫助客戶節省購物時間,同時透過對話式 的討論取得重要資訊。 亞馬遜在宣布此舉的網誌中形容,新功 能「使產品研究變得有趣和方便」,宛如一些 有幫助的朋友討論買東西,使用戶購物變得 更輕鬆,即使用戶有多項事情要辦或正在路 途之中。 新AI產品摘要目前適用一些美國客戶和 指定產品。亞馬遜計劃未來數月把功能延伸 至更多產品和更多美國客戶。 該公司解釋,該項服務會利用客戶評價 和網上資訊,再利用大型語言模型(LLMs)來 生成腳本,轉變成簡短的音訊。 亞馬遜表示,該項語音摘要是其現有AI 購物功能的一部份,其他包括生成式AI購物 助理Rufus和留意符合用戶興趣的新產品的AI 功能Interests。 本報訊 ■Flow可製作最長八秒的視頻。 谷歌 ■布林現身谷歌I/O大 會,承認當年開發智 能眼鏡犯了不少錯。 視頻截圖 ■布林2013年戴著谷 歌眼鏡出席活動。 美聯社資料圖片 亞馬遜購物參考 可聽AI語 摘要 ■亞馬遜利用AI生成產品摘要。 亞馬遜 ■網民們一起參與利用谷歌街景展開的公路 之旅。 Internet Roadtrip 谷歌希望利用人工智能(AI)製作視 頻更容易,推出一個新的工具來實現這 個目標,稱作Flow。同時還發布多個新 模型及其更新,包括最新的Veo 3影片生 成模型,Veo 2模型的更多控制功能,和 圖像生成模型Imagen 4。 谷歌共創人布林承認 當年開發智能眼鏡犯錯 ■Veo 3生成的視頻可包括音頻。 谷歌 ■Imagen 4創作的圖像內含文字拼寫正確。 谷歌 星期一至五 早上八點半及下午五點半, 星島中文電台網上 www.chineseradio.com 或 手機 app singtao tv 都可以收聽 分享無距離, 主持人莫少康, 每日為你精簡分析 洛杉磯新聞新動向, 每日洛事。 洛杉磯, 一個繁忙熱 鬧嘅天使之 城,居住有 唔同種族、 唔 同 文 化 嘅人在內, 每一日發生 嘅 大 小 事 項,不計其 數,當中身 處其他城市 嘅你,又了 解幾多呢? 每日洛事

RkJQdWJsaXNoZXIy ODc1MTYz