05-22-2025星島日報(洛杉磯版)

B2 05.22.2025 星期四矽谷科技據科技網站The Verge報道，使用Flow，你可以透過如文字轉影片提示或素材轉影片提示，來製作最長八秒的AI生成影片。素材轉影片基本上是上傳幾張圖片，再搭配提示文字，幫助模型理解你想要的內容。然後，使用Flow的場景建構器工具，將多個片段拼接在一起。 Flow似乎有點像影片剪輯應用程式，但目的是專門用來製作AI生成影片。谷歌實驗室（Google Labs）的產品經理伊利奇（Thomas Iljic）展示了Flow的一些實際應用範例，如一部動畫風格的影片：「攝影機」先拉遠，揭示原來畫面是在電視上播放，接著畫面再次拉遠，顯示出電視所在的房間。然後，「攝影機」慢慢飛出窗外，看到一輛卡車駛過。影片整體看起來相當流暢，伊利奇稱， Flow的理念並不在於製作長影片，而是為了幫助電影製作人快速將他們的想法紀錄下來。對於谷歌在I/O大會上發布的新模型，谷歌DeepMind創意主管洛蘭（Matthieu Lorrain）表示，Veo 3將擁有更佳的畫質，並且更容易下提示，同時生成影片和聲音（包括對話）。它在理解較長的提示方面也更強，能正確處理在提示中描述的一系列事件。 Veo 2 將提供如鏡頭控制和物件移除等工具。谷歌新的圖像生成模型Imagen 4的品質有所提升，不僅可以導出更多格式，還有更擅長生成可讀的文字，而不是這些圖像中經常出現的AI亂碼。 Flow已於近日在美國推出，開放給訂閱谷歌全新的Google AI Pro和Google AI Ultra 方案的用戶。谷歌稱AI Pro提供Flow的主要功能，每月可生成100次創作，而AI Ultra 提供更高的使用上限，並可優先體驗支援原生音訊生成的Veo 3模型。谷歌連推多款AI生成新模型 Flow創作8秒視頻 Veo3影片含音頻 Imagen 4圖內文字拼寫正確互聯網公路旅行千人同遊樂逍遙 ▍本報訊 ▍ 谷歌本周在2025年I/O 大會上宣布重新投入智能眼鏡市場，與多家公司合作開發建立於Android XR平台的智能眼鏡等隨身裝置，其聯合創始人布林（Sergey Brin）同日活動上公開承認，當年推動谷歌眼鏡（Google Glass）時「犯了很多錯誤」。這場訪談由著名播客「Big Technology Podcast」主持人坎特羅維茨（Alex Kantrowitz）主持，事先宣布的受訪者是谷歌A I部門 DeepMind執行長哈薩比斯（Demis Hassabis），布林的現身則是出人意料的驚喜插曲。布林憶述，當年「對消費性電子產品的供應鏈一無所知」，也不了解要以合理價格製造智能眼鏡有多困難。對於這次谷歌重新出發，他強調對智能眼鏡這種產品形式深具信心，這次「有優秀的合作夥伴幫助我們打造這款產品」。谷歌最新的智能眼鏡開發計劃，由 DeepMind的Project Astra提供AI支援，能夠執行即時翻譯、提供導航指引，並處理一般的AI查詢。谷歌將與一系列合作夥伴攜手合作，包括三星和Xreal等公司。谷歌還承諾投資高達1.5億元與時尚眼鏡品牌Warby Parker 建立合作關係，並對該公司進行股權投資，以支持谷歌的智能眼鏡開發計劃。布林表示，與經驗豐富的眼鏡和電子產品製造商合作，有助解決生產智能眼鏡所涉及的一些供應鏈問題。他還指出，生成式AI 的出現，讓智能眼鏡的功能比起當年Google Glass推出時，變得「更具實際可行性」。本報訊你聽著緬因州鮑登學院（ B o w d o i n College）的廣播電台，夾雜著周圍的汽車喇叭聲，但你不在緬因州，也不在車裡，而是在電腦前玩一個大型多人在線公路旅行遊戲「Internet Roadtrip」。遊戲開發者阿加瓦爾（Neal Agarwal）稱之為「公路旅行模擬器」，每隔10秒，觀眾就會在谷歌街景上投票決定「汽車」的行駛方向，也可以投票決定按喇叭或換廣播電台。科技網站Te chCr uch指出，I n t e r ne t Roadtrip讓人想起10多年前的標誌性串流遊戲Twitch Plays Pokmon，也是讓觀眾投票決定按下哪個按鈕作為遊戲的一部分。但 Internet Roadtrip遠沒有那麼混亂——因為一次只有大約1000人在玩，而且因為有了比過去更好的組織工具，參與者在通訊平台 Discord交流。這場虛擬公路之旅進展緩慢，「汽車」以比走路還慢的速度行駛，版主需要向新來者解釋，從緬因州開車去拉斯維加斯是沒有意義的，因為可能需要近10個月的時間，去阿拉斯加也一樣，因為受困於「谷歌街景的工作原理是拍攝多張照片並將它們放在一起。在通往阿拉斯加的一些道路上，圖片上有空白，如果走這些道路，我們會被困在那裡。」與GeoGuessr等其他基於街景的遊戲不同，Internet Roadtrip沒有目標。遊戲參與者都明白，目的地並不是目的——它是一種快樂，一種在欣賞緬因州風景優美的鄉間小路的同時，與一千個陌生人在網上自發地聽著一所文科大學廣播的快樂。本報訊電商平台亞馬遜21日宣布，正在指定產品頁面上測試由人工智能（AI）生成的語音版產品摘要。這些語音摘要由亞馬遜所稱的「AI 購物專家」讀出，會討論重要的產品功能、客戶評價和來自網上的相關資訊。只要從亞馬遜購物應用程式中點擊「聆聽精彩內容」（Hear the highlights）按鈕，就能聽到AI生成的產品摘要。亞馬遜表示，該測試會針對一般需要考慮才會購買的產品，旨在幫助客戶節省購物時間，同時透過對話式的討論取得重要資訊。亞馬遜在宣布此舉的網誌中形容，新功能「使產品研究變得有趣和方便」，宛如一些有幫助的朋友討論買東西，使用戶購物變得更輕鬆，即使用戶有多項事情要辦或正在路途之中。新AI產品摘要目前適用一些美國客戶和指定產品。亞馬遜計劃未來數月把功能延伸至更多產品和更多美國客戶。該公司解釋，該項服務會利用客戶評價和網上資訊，再利用大型語言模型（LLMs）來生成腳本，轉變成簡短的音訊。亞馬遜表示，該項語音摘要是其現有AI 購物功能的一部份，其他包括生成式AI購物助理Rufus和留意符合用戶興趣的新產品的AI 功能Interests。本報訊 ■Flow可製作最長八秒的視頻。谷歌 ■布林現身谷歌I/O大會，承認當年開發智能眼鏡犯了不少錯。視頻截圖 ■布林2013年戴著谷歌眼鏡出席活動。美聯社資料圖片亞馬遜購物參考可聽AI語摘要 ■亞馬遜利用AI生成產品摘要。亞馬遜 ■網民們一起參與利用谷歌街景展開的公路之旅。 Internet Roadtrip 谷歌希望利用人工智能（AI）製作視頻更容易，推出一個新的工具來實現這個目標，稱作Flow。同時還發布多個新模型及其更新，包括最新的Veo 3影片生成模型，Veo 2模型的更多控制功能，和圖像生成模型Imagen 4。谷歌共創人布林承認當年開發智能眼鏡犯錯 ■Veo 3生成的視頻可包括音頻。谷歌 ■Imagen 4創作的圖像內含文字拼寫正確。谷歌星期一至五早上八點半及下午五點半，星島中文電台網上 www.chineseradio.com 或手機 app singtao tv 都可以收聽分享無距離，主持人莫少康，每日為你精簡分析洛杉磯新聞新動向，每日洛事。洛杉磯, 一個繁忙熱鬧嘅天使之城，居住有唔同種族、唔同文化嘅人在內，每一日發生嘅大小事項，不計其數，當中身處其他城市嘅你，又了解幾多呢？每日洛事

Made with FlippingBook

RkJQdWJsaXNoZXIy ODc1MTYz