作者:
unlucky (è¬ç¥žå»Ÿé–€å£å«åŒ–åder)
2026-05-14 23:20:40因為我的需求很不適合在電蝦版問,
也會夾雜很多R18 二次元的疑問,
我就跑來這裡問眾神了.
我想要利用Ai協助的目的以其相關問題如下
……
1. R18 內容幾乎是不被主流線上ai服務允許的
當然也可以把需要ai的環節
拆成R18和健全的部分
但那還是要彎彎繞繞 拆解步驟
2. 音聲翻譯 有附原文台本
沒人翻譯或不開放翻譯的作品
3. 音聲翻譯 沒有附原文台本
只能靠音檔轉文字 再翻譯
這是我最主要的目的
我在ai發問
回答是
本地LLM
3060/4060 至少12gb顯存
記憶體32gb
硬碟用m.2比較快
模型越大越好 預算很有限
我想確認假如我弄到5070ti 16gb
本地跑未經審查的模型 可不可行?
出來的結果是堪用?還是連堪用都不行?
如果堪用都做不到
我就認命不浪費心力玩這個了
4. 我可能對色圖生圖有一點興趣
但這是順便玩的
更大的可能是我光是玩機翻就消耗很多心力
畢竟工具在怎好用 也要學要用
非正事的需求 我對自己的意志力沒太對信心
不是花錢買硬體就沒事
我應該不會玩R18 文字創作 聊天
圖片僅限於單圖
根據常識 動畫類消耗的算力更恐怖
所以我一開始就放掉了
真要有興趣是三次元的
不在本版討論範圍
問題開頭我有提到
線上服務基本上r18用途限制很多
我也認為不是所有人都有條件去玩本地ai
你們有沒有什麼拆解步驟
局部利用既有線上ai
完成自己在二次元R18需求的例子?
我能說的只有
DeepL線上翻譯
Google網頁翻譯能做到的事已經很多
DLsite的簡介基本上也能理解5成的文意
就是音聲作品裡面如果台本是pdf檔案
是可以動手複製 很麻煩就是了
三次元的神人
用Google 智慧鏡頭截圖
只要截圖沒有涉及器官和色色行為
背景又有足夠多的訊息
例如截圖不要把棒子截進去
選擇敏感點在邊緣的畫面
就能找到影片番號的來源
二次元的本子搞不好也能這樣做
只是我很久沒看二次元本子了.
問題問題
聽說有人走蘋果電腦路線
也是可以玩ai?穩妥嗎?
還是規規矩矩N卡就好?
作者:
gtfour (朱兆蘭)
2026-05-15 00:00:00能用色圖生圖 去pixai就很簡單好用了 我畫好一堆圖都還沒空一一下載整理分類 是說pixai的生成圖片有什麼快速跳到以前畫好的圖的方法嗎?還是只能慢慢往下拉等它讀取 搜尋功能我也搞不懂要怎麼使用才會直接跳到我要找的日期
作者:
Armour13 (鎧甲)
2026-05-15 00:20:00只跑翻譯5070ti就夠了,翻譯沒有那麼吃資源。 生圖的話沒有要很高清的,5070TI 一分鐘也能跑一張吧你主要的問題是音檔轉文字,音聲很難轉的精準....跑日文作品翻譯的話,本地部屬Sakura模型,去機翻輕小說,把文本扔上去跑本地最簡單
音聲很簡單,語音辨識whisper模型就能對八成了,而且線上服務沒擋這個,本地有張1060就能跑個tiny吧,新顯卡直接跑large turbo版本,轉出srt之後丟個google翻譯。生圖可以爬aI_art板,種類太多了很難一次講清楚
現在Deepseek基本無甲,whisper後直接api翻譯就好本地翻譯Gemma 4 31b效果好,但q8要48gb vramWhisperjav 可以試試看,github 本地用whisper加上qwen兩段式音轉文提高識別率後用deepseek理解上下文並翻譯澀圖二次元的話16gb vram夠用,目前主流是anima跟IL。你要三次元還有klein 9b,但最好是24gb vram以上才能爽用全部模型例如qwen image。要影片則24gb vram外最好至少64GB ram
作者:
Tosca (hi)
2026-05-15 09:07:00三次元其實IL和qwen image edit就夠了
作者:
cmi5288 (目指せ!大魔法使い)
2026-05-15 11:03:00anime-whisper有針對喘息等微調,18+感覺有比較準現在8G左右LLM翻譯已經很不錯了,轉譯有誤也會修正後翻譯
作者:
Srwx (Srwx)
2026-05-15 13:27:00純翻譯不太會擋 甚至直接丟R18音源要生出文本也可以
本地LLM能不能跑要看模型大小我的4060 8GB可以順跑的等級在7b左右,但模型要量化12b雖然還是能跑,但就算量化還是很勉強生圖用的SDXL模型也是要量化過的才不會out of memory文字生成的品質我就不太清楚了,以前只試過翻譯
Sdxl bf16才6gb多而已 除非你是做upscaling沒開tiled decode 在建議解析度(1-1.5mp)下文生圖8g vram是足夠的
LLM本質看顯存跟模型 有多大用多大 效果也遞增真的要用本地的話 最簡單的方案真的是mac
作者:
guogu 2026-05-15 15:43:00翻譯還是越大越好 雖然很多人說單機的也夠用但是我用openrouter試各家的大模型翻譯亦有好壞那種7B 1xB之類的還是翻得不太好 就是能看懂那樣
5070ti能讓你做到的還是很有限 不論llm/生圖/lora等
作者:
yeeouo (林翔)
2026-05-16 01:08:00vram越大越好 沒有夠用一說 消費級顯卡離資料中心遇到scaling law出現邊際效應超級遠 導致開源小模型參數規模變大品質都是大幅提升
作者:
Tosca (hi)
2026-05-16 09:11:005070ti生圖應該是綽綽有餘了啦 我mac mini都很夠用了
作者:
unlucky (è¬ç¥žå»Ÿé–€å£å«åŒ–åder)
2026-05-16 09:12:00Mac有什麼優缺?或者說你們是本來有Mac發現順便能玩ai就試試看片知道Mac的架構似乎是同樣容量cp值最高但生態有沒windows+N卡主流還豐富我以前幫人轉資料過 Mac外接硬碟格式不太一樣?自身容量又很小 不接nas的話很頭痛?我是很賭爛win11了 但收藏整理工具和大量資料和win綁定Mac mini比5070ti便宜Pro 也不錯了 24gb統一記憶體
作者:
Porops (豬排)
2026-05-16 13:00:00實際用過本地AI翻譯就知道了,之所以規模越大品質提升是因為大部分的通用模型都要支援多模態,要能夠應對你所有問題翻譯AI不用考慮這些,上面都是專精日翻中ACG,可以和你保證你找30B的本地模型絕對比不上這些14B甚至7B的效果個人都在自己拿來持續翻譯上千萬文字的網路小說,差距實在很明顯
欸樓上我有不一樣的觀點,現在Gemma 31b 這種多模態看圖再翻譯會比純文字模型好所以要看應用場景,漫畫類的用多模態模型翻譯質量已經可以很通順又符合畫面劇情了
作者:
Porops (豬排)
2026-05-17 01:19:00我的應用場景自然是翻譯AI阿,你要整個多模態AI自然又不一樣比較了,那當然和我講的是完全兩回事
作者:
unlucky (è¬ç¥žå»Ÿé–€å£å«åŒ–åder)
2026-05-17 20:13:00我圖片類的全放掉了 真要玩就專心台本翻譯和聲音轉文字