Chào các bạn, hôm nay mình muốn chia sẻ khá dài dòng về việc chọn AI nào để viết script làm ytb(dạng long video). Nếu bạn cũng còn băn khoăn vì sao video nghe cũng hay mà mãi lẹt đẹt view thì thử đọc hết bài viết nhé. Bài này không nhằm giúp bạn chọn luôn con AI nào, bạn phải thực hành, phải so sánh, phải test với cùng 1 môi trường, 1 bộ file .md hướng dẫn cho AI thì mới biết con nào phù hợp với nội dung của bạn.
Mình là Hưng, mình đang làm 1,2 kênh dạng 2d cartoon slide ảnh khớp voice dạng chủ đề Finance niche(các kênh mình tham khảo đầu tiên là Nick Invests, Bob Invests(kênh này mới bị tkt), Alicia Invests, Tom Talks Money,... và mình đem về làm ở VN và Spanish Global -- Các b có thể đọc kĩ hơn ở 1 bài post chia sẻ thành công của mình trong profile cá nhân này)
Không có 1 câu trả lời chính xác cho AI nào, model AI nào viết script để các bạn làm kịch bản cho video youtube tốt nhất cả, mỗi con AI có một điểm mạnh riêng và thế mạnh riêng.
(ẢNH 1: Gemini; ẢNH 2: Claude. Cùng một outline nội dung, cùng 1 prompt yêu cầu viết script, chưa chỉnh gì thêm, output lần đầu)
Cá nhân mình dùng loanh quanh 3 con AI và thử test với model mạnh nhất của mỗi con là Gemini(Pro 3.1) , Chatgpt(Thinking Lâu hơn), và Claude(Opus 4.7). Với cùng 1 bộ file DNA, STYLE... của kênh chung cho cả 3 AI thì CẢM NHẬN CÁ NHÂN của mình như sau:
- Gemini: Văn phong tiếng việt cực tốt. Các AI trên thị trường dùng và train tiếng anh là chính, nhưng chỉ có riêng Gemini cho mình cảm nhận là nó hiểu ngữ cảnh, ngôn ngữ tiếng việt nhất. Con này sẽ rất phù hợp cho việc bạn muốn tinh chỉnh Script mượt mà, chỉ cần ném vào AI Text-to-speech để ra voice luôn, không phải ngồi chỉnh lại từng chữ nếu không cần quá hay và đúng văn phong bạn muốn. Tiếng việt đã tốt như vậy rồi, chứng tỏ được rằng nó có thể hiểu được nhiều ngôn ngữ khác, thích hợp cho việc làm nội dung ở những ngôn ngữ mà bạn khó nắm bắt được như tây ban nha, hàn, nhật... mà có thể có được văn phong văn hóa nói chuyện của ngôn ngữ đó. NHƯNG cũng cần điều chỉnh sao cho giọng văn phù hợp, con này thường dùng rất nhiều phép ẩn dụ, hoán dụ, ví von, so sánh rất là AI và dùng lại nhiều lần. Đòi hỏi đầu vào dữ liệu nghiên cứu cũng như prompt yêu cầu cụ thể nếu không nó sẽ trả ra kết quả khá kém. Điểm yếu nữa là context ngắn, viết thường ngắn hơn yêu cầu. nếu có thời gian nên cho viết từng đoạn chứ viết full script thì cần check kĩ.
2. Chatgpt: Cảm giác hợp cho các dạng script dài, đối tượng khán giả chỉ nghe cho mục đích thư giãn,chứ để đọng lại hay phải gật gù thì rất khó. Con này cực kì lan man, phân tích thì cũng có vẻ hay nhưng tổng thể không có sự hấp dẫn, một số video mình dùng script của nó vì cũng hay, nhưng đổi chủ đề khác thì sửa đi sửa lại cũng không thể thấm nổi. Con này thì cực kì lan man và ngược với Gemini ở context dài, mình yêu cầu nó tăng lên 4000 từ chẳng hạn, nó có thể tự kéo dài tới 9000 từ nếu không nói rõ. Nhưng đôi lúc nó trả output số từ, kí tự cực kì sát và chính xác nhất trong 3 con AI hôm nay mình so sánh, nếu bảo viết liền 5000 từ thì độ chênh lệch chỉ khoảng ~100 từ. Nhưng chính vì nó cho sát như thế nên điểm yếu là nó cố làm hài lòng yêu cầu gần nhất của người dùng, còn về nội dung thì nếu là người làm nhiều video rồi sẽ thấy 1 điểm yếu chí mạng là cực kì lan man và dù nghe hay nhưng sẽ khó đọng lại được ý nghĩa nếu muốn video có tỉ lệ giữ chân cao và người ta comment vì thấy quá hay và bất ngờ với script. Nó ưu tiên độ an toàn của video.
3. Claude: Được mọi người tung hô khá nhiều là văn logic, suy luận tốt. Mình khung phủ nhận điều này nếu như bạn dùng model mạnh mẽ như Opus, nhưng nếu bảo là script nó đưa thực sự hay thì mình không chắc, về tổng thể đọc lướt qua thì logic thật, hấp dẫn thật, nhưng nhìn kĩ đi, những từ ngữ nó dùng rất cụt ngủn, thiếu sự tinh ý thay đổi cho hợp bối cảnh. Mình đã từng gặp tình cảnh nó dịch word-by-word cụm từ tiếng anh sang tiếng việt là "tiền phòng thủ" thay vì "quỹ dự phòng/tiền phòng thân" cho hợp văn phong giao tiếp người Việt. Mình cố bảo nó sửa thì nó chỉ sửa được 1 số chỗ thôi, không thể đảm bảo nó sửa ổn mà không check lại được. Và con này với chatgpt có 1 điểm yếu giống nhau là cách hành văn AI pattern kiểu "không...không...không..." Nhiều bạn bảo dùng prompt chặn AI pattern hay cấm dùng các từ ngữ kiểu AI, dấu "gạch ngang" AI nhưng vấn đề không nằm ở đó, vấn đề là cái ngôn ngữ của nó được train và dữ liệu nghiên cứu của nó chỉ được như vậy, nó không có ngôn ngữ google như Gemini để hiểu à câu văn này nên dài ra mới hợp tiếng việt. Trong ảnh 2, Mình ghét cái kiểu "Nó được thiết kế"(sao không kiểu "hệ thống thiết kế để bạn cảm thấy như vậy", "bóc cho bạn"(ủa bóc seal hay bóc hàng gì má).
===> TÓM LẠI: Đây là quan điểm cá nhân của mình, vì mình làm dạng nội dung thiên về giữ chân người xem bằng kiến thức mang tính giáo dục, truyền đạt thông tin đa chiều, văn phong có độ con người nên mình thích Gemini hơn. Còn nếu bạn làm các dạng khác, như dạng tài liệu documentary, dạng mà cần văn phong lạnh, sắc, cứng cáp, không hoa mỹ văn chương thì mình nghĩ Claude phù hợp hơn vì tư duy của nó tổng thể khá ổn. Còn Chatgpt....hên xui, lúc hay lúc dở, viết ngắn và phân tích thì rất ok nhưng dài thì sẽ thường lan man.
Ngoài ra còn rất rất nhiều con AI khác để viết, tạo script kịch bản dài, nhưng mình chưa được sử dụng và cũng cảm thấy không có nhu cầu lắm vì đây là 3 con có thể nói gây tranh cãi và thắc mắc nhiều nhất rồi.