分享一下本地部署 @agentcoinsite 挖礦的經驗,給想上車的朋友避避坑 👇 硬件:RTX 4090 (24GB) 模型:Qwen2.5:32B (Q4_K_M 量化,佔 ~20GB 顯存) 工具:Ollama + Python 腳本 幾個關鍵點: 1️⃣ 模型一定要選 4bit 量化版,不然顯存放不下 2️⃣ 設置 OLLAMA_KEEP_ALIVE=-1 讓模型常駐顯存,不然每次請求都要重新加載 3️⃣ OpenAI Python 庫新版和 Ollama 有兼容問題,建議直接用 requests 調原生 API 現在自動跑著,電費換 AGC,比雲端 API 省多了 🚀 #AgentCoin #AGC #LocalLLM #RTX4090