คู่มือการเทรน Flux Dev AI Model LoRA บน Cloud GPU ด้วย RunPod

Gasia
20 มี.ค. 2568
ยาว 2 นาที

คู่มือการเทรน Flux Dev AI Model LoRA บน Cloud GPU ด้วย RunPod

การสร้างโมเดล AI ดิจิทัลของคุณเองอาจฟังดูยุ่งยากและมีค่าใช้จ่ายสูง แต่จริงๆ แล้ว หากมีเครื่องมือที่เหมาะสมและการแนะนำที่ถูกต้อง ทุกคนก็สามารถสร้างโมเดล AI คุณภาพสูงได้โดยไม่จำเป็นต้องลงทุนหนัก ในบทความนี้เราจะมาเรียนรู้วิธีการสร้างและฝึกโมเดล Flux AI ด้วยเทคนิค LoRA บนแพลตฟอร์ม RunPod ผ่าน ComfyUI กันอย่างละเอียด เข้าใจง่าย ไปดูกันเลย!

ทำไมต้อง Flux LoRA และ RunPod?

Flux เป็นโมเดล AI ที่โดดเด่นด้านการแปลงข้อความเป็นภาพ โดยเฉพาะอย่างยิ่งการสร้างภาพบุคคลที่มีรายละเอียดสูง ส่วน LoRA (Low-Rank Adaptation) เป็นเทคนิคที่ช่วยให้คุณสามารถปรับแต่งโมเดล AI สำเร็จรูปเช่น Flux ให้กลายเป็นโมเดลที่มีเอกลักษณ์เฉพาะของคุณเองได้

RunPod เป็นผู้ให้บริการ GPU แบบ Cloud ที่ราคาเข้าถึงง่าย ไม่ต้องลงทุนซื้อฮาร์ดแวร์แพงๆ ด้วยตนเอง ทำให้ทุกคนสามารถฝึกโมเดล AI ได้ง่ายและคุ้มค่า

ลิงก์แนะนำ

ขั้นตอนที่ 1: เตรียมชุดข้อมูลของคุณ (Dataset)

รวบรวมภาพถ่ายเลือกภาพถ่ายคุณภาพสูงที่คุณต้องการฝึกโมเดล AI โดยควรมีหลากหลายชุดแต่งกาย หลากหลายท่าทาง และฉากต่างๆ ตั้งชื่อภาพให้เรียงลำดับ เช่น 1.jpg, 2.jpg เป็นต้น
สร้างคำบรรยายภาพ (Captions)ใช้ ComfyUI และ Florence 2 เพื่อสร้างคำบรรยายที่สอดคล้องและละเอียดสำหรับแต่ละภาพ สิ่งนี้ช่วยเพิ่มความแม่นยำในการฝึก AI
ปรับแต่งคำบรรยายให้ละเอียดขึ้นนำคำบรรยายที่ได้ไปปรับแต่งเพิ่มเติมในโปรแกรมเช่น Notepad++ เพื่อให้คำบรรยายมีความเจาะจง เช่น จาก "ภาพนี้คือหญิงสาว" ปรับเป็น "ภาพ Instagram ของผู้หญิงอายุ 48 ปี"

ขั้นตอนที่ 2: ตั้งค่า RunPod

เลือกใช้งาน GPU
- ไปที่ RunPod คลิก “Deploy New Pod”
- เลือก "GPU" และ "Community Cloud"
- เลือก “Extreme Internet Speed” เพื่อการดาวน์โหลดไฟล์ที่รวดเร็ว
- GPU ที่แนะนำ: A40 (VRAM 48GB, RAM 50GB, CPU 9 cores) เหมาะสมกับการใช้งานและราคา
ตั้งค่าระบบของ Pod
- เลือก “PyTorch 2.2 template with Python 3.10 และ CUDA 12.1.1”
- ปรับขนาด disk และ volume เป็น 120GB
- เปิดพอร์ต 8188 สำหรับ ComfyUI
เชื่อมต่อกับ Podคลิกที่ "Connect" เพื่อเข้าใช้งานผ่านอินเทอร์เฟซ Jupyter Notebook

ขั้นตอนที่ 3: ติดตั้ง ComfyUI และ AI-Toolkit

ติดตั้ง ComfyUI

ใน Terminal บน Jupyter Notebook รันคำสั่งต่อไปนี้:

-----------------------

git clone https://github.com/ComfyAnonymous/ComfyUI.git

python -m venv venv

source venv/bin/activate

pip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu124

cd ComfyUI

pip install -r requirements.txt

cd custom_nodes

git clone https://github.com/ltdrdata/ComfyUI-Manager.git

-----------------------

ติดตั้ง AI-Toolkit

เปิด Terminal ใหม่ แล้วรัน:

git clone https://github.com/ostris/ai-toolkit.git

สร้าง Hugging Face Access Token จากเว็บ Hugging Face
นำ token มาใส่ในไฟล์ .env:

echo "HF_TOKEN=your_token_here" > .env

ขั้นตอนที่ 4: ตั้งค่าและเริ่มฝึกโมเดล LoRA

ตั้งค่า YAML file สำหรับการฝึกไปที่ AI-Toolkit/configs สร้างไฟล์ YAML ใหม่ (เช่น elara.yaml) ตั้งค่าพารามิเตอร์ตามที่ต้องการ
เริ่มฝึกโมเดลรันคำสั่ง:

python run.py config/elara.yaml

ขั้นตอนที่ 5: ติดตามผล ดาวน์โหลด และทดสอบโมเดล LoRA ของคุณ

ติดตามการฝึกโมเดลระหว่างการฝึกสามารถเข้าไปดูใน Output Folder เพื่อดูตัวอย่างภาพที่โมเดลสร้างขึ้นจากข้อมูลการฝึกได้ตลอดเวลา
ดาวน์โหลด LoRA ที่ฝึกเสร็จแล้วหลังจากฝึกเสร็จ ดาวน์โหลดไฟล์โมเดล LoRA จาก Output Folder ของ AI-Toolkit ลงเครื่องคอมพิวเตอร์ของคุณเอง
ทดสอบโมเดล LoRA ใน ComfyUIเปิด ComfyUI ใช้ Flux Workflow ของคุณ โหลดโมเดล LoRA ที่ฝึกไว้ ปรับน้ำหนัก LoRA ตามต้องการ แล้วลองสร้างภาพจากโมเดล AI ใหม่ได้เลย!

---------------------

อ้างอิง : https://blog.pixelailabs.com/flux-dev-ai-model-lora-training-on-cloud-gpu-08-31-2024