Mark Theriault 創(chuàng)立了初創(chuàng)公司 FITY,致力于推出一系列智能制冷產(chǎn)品:用可冷凍的圓片對飲料杯進(jìn)行制冷,無需雜亂的冰塊即可讓飲料保持更長時間的低溫狀態(tài)。這位企業(yè)家從地下室一次只能制作一件產(chǎn)品的 3D 打印起步,最終擴(kuò)大規(guī)模,實(shí)現(xiàn)批量生產(chǎn)。
單槍匹馬從零開始創(chuàng)辦一家消費(fèi)品公司是一項(xiàng)艱巨的任務(wù)。從初步草圖到可投入生產(chǎn)的設(shè)計,他面臨艱巨的挑戰(zhàn)。Theriault 借助 AI 以及搭載 NVIDIA GeForce RTX 的系統(tǒng)將創(chuàng)意變?yōu)楝F(xiàn)實(shí)。對他而言,AI 不僅僅是一種工具,更是助力他實(shí)現(xiàn)目標(biāo)的完整工作流。
從概念到成品
Theriault 想要做出讓人眼前一亮的產(chǎn)品時,都是一步步“折騰”出來的:先手繪草圖,再用電腦建模,接著做快速打樣,不斷試錯,直到找到自己心里最滿意的設(shè)計為止。FITY Flex 設(shè)計的一個獨(dú)特之處在于,可以使用有趣、流行的鞋飾對其進(jìn)行定制。
為獲得包裝設(shè)計靈感,Theriault 采用他首選的文本轉(zhuǎn)圖像生成式 AI 模型 Stable Diffusion XL 進(jìn)行原型設(shè)計。該模型采用基于節(jié)點(diǎn)的模塊化界面 ComfyUI,借助 NVIDIA TensorRT 軟件開發(fā)套件,運(yùn)行速度提高了 60%。
ComfyUI 讓用戶能夠精細(xì)控制生成流程的每一步,包括提示、采樣、模型加載、圖像調(diào)整和后處理。對于 Theriault 這樣想要定制圖像生成方式的高級用戶而言,ComfyUI 是理想的選擇。
基于 NVIDIA Blackwell 架構(gòu)的 NVIDIA 和 GeForce RTX GPU 采用專為加速 AI 和深度學(xué)習(xí)工作負(fù)載而設(shè)計的第五代 Tensor Core。這些 GPU 與 PyTorch 中的 CUDA 優(yōu)化技術(shù)協(xié)同運(yùn)行,可無縫加速 ComfyUI,從而將 Black Forest Labs 圖像生成模型 FLUX.1-dev 每張圖像的生成時間從 Mac M3 Ultra 上的 2 分鐘縮短至在 GeForce RTX 5090 顯卡上的 4 秒左右。
ComfyUI 還能加上 ControlNet,這是一種能幫你更精細(xì)控制出圖效果的 AI 模型。Theriault 就經(jīng)常用它來干點(diǎn)“花活”,比如指定人物的姿勢、用深度圖來安排畫面的構(gòu)圖,甚至能把草圖、手繪稿直接變成成品圖像。
Theriault 甚至自行設(shè)計了經(jīng)過微調(diào)的模型,以保持一致的個人風(fēng)格。他采用低秩適配(LoRA)模型,這些一種小巧、高效適配器,集成到網(wǎng)絡(luò)特定層,可以盡可能低的計算成本實(shí)現(xiàn)高度定制化生成。
“過去幾個月,使用我在內(nèi)部訓(xùn)練的定制 Flux LoRA,我從 AI 輔助計算機(jī)圖形渲染過渡到完全由 AI 生成的產(chǎn)品圖像。為了獲得快速訓(xùn)練和迭代所需的性能,我的 RTX 4080 SUPER GPU 至關(guān)重要。”——Mark Theriault,F(xiàn)ITY 創(chuàng)始人
Theriault 還利用生成式 AI 來創(chuàng)建營銷素材,如 FITY Flex 產(chǎn)品包裝。他使用 FLUX.1,該模型擅長為圖像生成清晰易懂的文本,從而解決文本轉(zhuǎn)圖像模型中常見的挑戰(zhàn)。
雖然 FLUX.1 模型的顯存消耗通常超過 23GB,但 NVIDIA 與 Black Forest Labs 合作,通過量化(一種在保持質(zhì)量的同時減小模型大小的技術(shù))減小了這些模型的大小。隨后使用 TensorRT 對模型進(jìn)行加速,與 PyTorch 相比,速度提升高達(dá) 2 倍。
為了簡化這些模型在 ComfyUI 中的使用,NVIDIA 構(gòu)建了 FLUX.1 NIM 微服務(wù),這是 FLUX.1 的容器化版本,可以在 ComfyUI 中加載,并支持 FP4 量化和 TensorRT。將這些模型相結(jié)合,顯存消耗降至 11GB 出頭,而性能提升了 2.5 倍。
Theriault 使用 Blender Cycles 應(yīng)用來渲染最終文件。對于 3D 工作流,NVIDIA 提供面向 3D 引導(dǎo)生成式 AI 的 AI Blueprint,可簡化 3D 圖像的定位與合成,對這種方法感興趣的任何人都可以快速入門。
最后,Theriault 還利用大語言模型來生成營銷文案,并根據(jù)搜索引擎優(yōu)化、語氣和故事情節(jié)進(jìn)行定制。此外,他還利用這些模型完成專利申請和臨時申請,而這些工作通常需要花費(fèi)數(shù)千美元的法務(wù)費(fèi)用和大量的時間。
Theriault 表示,每個紋理、每個詞語、每張照片、每個配件都是一個微小的決策。他補(bǔ)充道,AI 幫助他跨越了可能阻礙獨(dú)立創(chuàng)業(yè)者的“刀山火?!?。
“作為一個需要生成大量內(nèi)容的單人團(tuán)隊(duì),擁有產(chǎn)品設(shè)計的實(shí)時生成能力確實(shí)有助于加快進(jìn)度?!薄狹ark Theriault,F(xiàn)ITY 創(chuàng)始人
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5696瀏覽量
110139 -
gpu
+關(guān)注
關(guān)注
28文章
5283瀏覽量
136097 -
AI
+關(guān)注
關(guān)注
91文章
41315瀏覽量
302690
原文標(biāo)題:從概念到成品:生成式 AI 助力單槍匹馬從零開始創(chuàng)辦一家消費(fèi)品公司
文章出處:【微信號:NVIDIA_China,微信公眾號:NVIDIA英偉達(dá)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
谷東智能攜多款AI眼鏡產(chǎn)品亮相第六屆中國國際消費(fèi)品博覽會
谷東智能邀您共赴第六屆中國國際消費(fèi)品博覽會
一句話,描述創(chuàng)芯工坊是一家什么樣的公司?
一家技術(shù)公司的長期主義:專注核心部件,驅(qū)動市場創(chuàng)新
打造智能彈性網(wǎng)絡(luò),擁抱消費(fèi)品創(chuàng)新挑戰(zhàn)
生成式AI助力創(chuàng)辦一家消費(fèi)品公司
評論