飛鼠ai創客實驗室 Polatouche's AI Maker Lab.

飛鼠ai創客實驗室 Polatouche's AI Maker Lab. 本執以創客(maker)的精神為宗旨,學習達文西大師一般玩轉科學與藝術並平衡的發展。將想像力與創意天馬行空、恣意地去發展,才是進步的原力。

15/02/2026

Wishing everyone great fortune in the Year of the Horse, and a Happy Lunar New Year 2026!

X平台上的Grok AI開始支持圖像生成!原來X平台的圖像生成背後的技術是由Black Forest Lab(從Stability AI出來)的FLUX.1技術支援。好消息是可以在X平台上快速生成且幾乎沒有內容限制的圖像;另一個潛在的擔憂人...
19/08/2024

X平台上的Grok AI開始支持圖像生成!
原來X平台的圖像生成背後的技術是由Black Forest Lab(從Stability AI出來)的FLUX.1技術支援。
好消息是可以在X平台上快速生成且幾乎沒有內容限制的圖像;另一個潛在的擔憂人之後X平台上可能的假新聞氾濫。
目前只對Premium和Premium Plus用戶開放

Elon Musk's Grok released a new AI image-generation feature on Tuesday night that, just like the AI chatbot, has very few safeguards. That means you can

微軟的GenAI工具Microsoft Designer發佈了行動版(Android與iOS平台)APP,(MS Designer: 有像copilot文生圖應用、像Canva的編輯設計功能),每天有15次的免費使用次數
18/07/2024

微軟的GenAI工具Microsoft Designer發佈了行動版(Android與iOS平台)APP,(MS Designer: 有像copilot文生圖應用、像Canva的編輯設計功能),每天有15次的免費使用次數

以OpenAI文字轉圖像模型DALL-E打造的Microsoft Designer新增行動程式版本,需要以微軟帳戶登入使用,免費版每日可生成15次圖像,Copilot Pro訂閱用戶則可生成100次

Tenstorrent計劃推出第二代多用途AI晶片,聲稱在某些領域比NVIDIA的AI GPU更高效且更便宜;設計的架構選擇不使用高頻寬記憶體(HBM),這是他們能降低成本和能耗的關鍵。
18/07/2024

Tenstorrent計劃推出第二代多用途AI晶片,聲稱在某些領域比NVIDIA的AI GPU更高效且更便宜;設計的架構選擇不使用高頻寬記憶體(HBM),這是他們能降低成本和能耗的關鍵。

傳奇晶片設計師 Jim Keller 打算設計比 NVIDIA 更高效的晶片,以降低 AI 應用價格並搶占市占率。 Jim Keller 目前在 AI 晶片新創公司 Tenstorrent 擔任執行長。他認為,很多市場都沒得到 NVIDIA 很好的服務,隨著 AI 應用擴展到智慧手機、....

總共花了一年多時間,新的AI發明專利下來了 #智能演算引擎系統
09/05/2024

總共花了一年多時間,新的AI發明專利下來了
#智能演算引擎系統

- Qualcomm高通AI Hub   https://aihub.qualcomm.com/ 為驍龍和高通平台提供超過75個優化AI模型: i.e. Whisper、ControlNet、Stable Diffusion和Baichua...
29/02/2024

- Qualcomm高通AI Hub
https://aihub.qualcomm.com/
為驍龍和高通平台提供超過75個優化AI模型: i.e. Whisper、ControlNet、Stable Diffusion和Baichuan-7B,可在不同執行環境(runtime)中打包,能夠在不同形態終端執行降低內存占用並提升AI能效(也將在Hugging Face和GitHub上提供)。
• 高通AI研究(Qualcomm AI Research)在Android智能手機和Windows PC上運行多模態大模型和定制大視覺模型。芯片-第三代驍龍8和面向PC的驍龍X Elite的推出。首個在Android智能手機上運行的大語言和視覺助理大模型(LLaVA),一個超過70億參數的大型多模態語言模型(LMM)

Access fully-optimized and ready-to-deploy AI models

23/02/2024

《Sora的野望:視頻生成模型用作世界模擬器》
可以參考我上一篇提到,Sora 是一個文本到視頻(text-to-video, t2v)的 AI 模型,可以根據文字指示創建長達一分鐘的逼真且充滿想像力的場景 - 能夠生成包含多個角色、不同動作類型和背景的複雜場景,並理解它們之間的關係。
Sora自然衝上目前最熱門論文的榜首,可以參考它的論文:
https://openai.com/research/video-generation-models-as-world-simulators
簡單做了以下論文《Video generation models as world simulators》的重點總結:
該論文提出了一個新的研究方向,即將視頻生成模型用作世界模擬器。
世界模擬器是一種可以用來模擬物理世界行為的計算機程式。
視頻生成模型是一種可以生成逼真視頻的機器學習模型。
該論文的研究表明,視頻生成模型可以用來模擬物理世界的各種方面,包括物體運動、光照、紋理等。
該論文的研究具有廣泛的潛在應用,包括機器人、遊戲、電影、視覺效果等。
具體來說,該論文提出了以下幾點貢獻:
該論文提出了一個新的訓練視頻生成模型的方法,該方法可以提高模型的模擬精度。
該論文展示了視頻生成模型可以用來模擬物理世界的各種方面。
該論文探討了視頻生成模型用作世界模擬器的潛在應用。
以下是該論文的一些具體研究結果:
該論文提出的訓練方法可以將視頻生成模型的模擬精度提高到前所未有的水平。
該論文展示了視頻生成模型可以用來模擬以下物理現象:
物體運動:視頻生成模型可以用來模擬物體的運動,包括物體的掉落、碰撞、滑動等。
光照:視頻生成模型可以用來模擬光照的影響,包括陰影、反射、折射等。
紋理:視頻生成模型可以用來模擬物體的紋理,包括木材、金屬、布料等。
該論文探討了視頻生成模型用作世界模擬器的潛在應用,包括:
機器人:視頻生成模型可以用來訓練機器人,使機器人能夠更好地理解和適應物理世界。
遊戲:視頻生成模型可以用來創建更逼真的遊戲世界。
電影:視頻生成模型可以用來製作更逼真的電影特效。
視覺效果:視頻生成模型可以用來創建更逼真的視覺效果。
總而言之,該論文提出了一個新的研究方向,即將視頻生成模型用作世界模擬器。該論文的研究具有廣泛的潛在應用,可以推動機器人、遊戲、電影、視覺效果等領域的發展。

17/02/2024
16/02/2024

OpenAI於2024.2.15發布了Sora,這是一種用文字描述(咒語)或靜態圖像來生成影片的 AI 模型,(文生影片/ 圖生影片) 又再一次帶來驚人的革命! Sora是建立OpenAI之前的技術基礎之上(包括 DALL-E 和 Imagen),其工作原理先將文字描述或靜態圖像轉換為一系列噪聲補丁,再以擴散模型來預測原始“乾淨”補丁。(擴散模型是一種機器學習模型,用於從噪聲數據中恢復原始信號。) Sora目前可以建立長達一分鐘的高解析度影片。底下是Sora生成的展示影片。
[原始資料出處: https://openai.com/sora]

Address

Taipei
10491

Website

Alerts

Be the first to know and let us send you an email when 飛鼠ai創客實驗室 Polatouche's AI Maker Lab. posts news and promotions. Your email address will not be used for any other purpose, and you can unsubscribe at any time.

Share