Trung tâm trợ giúp

Hướng dẫn tạo nội dung

Thành thạo mọi không gian làm việc — từ văn bản sang hình ảnh đến đối tượng 3D.

Cách tạo nội dung hoạt động

Mỗi lần tạo nội dung trên Gizmoji đều theo một quy trình đơn giản:

  1. Chọn một studio (Hình ảnh, Video, Âm thanh, Nhạc, 3D hoặc Avatar).
  2. Bấm Tạo — AI tự động chọn mô hình tốt nhất và điền các cài đặt tối ưu dựa trên ngữ cảnh của bạn. Điểm tín dụng được giữ trước và công việc được đưa vào hàng đợi.
  3. Theo dõi chỉ số tiến độ thời gian thực khi tài sản của bạn được tạo, với thời gian đã trôi qua được hiển thị.
  4. Tải xuống, lặp lại hoặc phê duyệt kết quả.

Muốn chọn một mô hình cụ thể hoặc điều chỉnh cài đặt? Bấm vào “Thay đổi mô hình / Nâng cao” để truy cập thư viện mô hình đầy đủ và tất cả các tham số.

Nếu một công việc thất bại vì bất kỳ lý do gì, điểm tín dụng của bạn sẽ được hoàn lại đầy đủ.

Chọn mô hình tự động

Khi làm việc trong một dự án, Gizmoji tự động chọn mô hình tốt nhất cho mỗi cảnh dựa trên ngữ cảnh sáng tạo của bạn — các tham khảo mà bạn đã liên kết, loại cảnh, chuyển động camera và phong cách hình ảnh. AI chọn từ ba cấp giá:

  • Ngân sách — Nhanh và tiết kiệm. Được sử dụng để thảo luận, lặp lại và khám phá ý tưởng nhanh chóng.
  • Giá trị — Độ chất lượng và chi phí cân bằng. Tốt nhất cho hầu hết các công việc sản xuất.
  • Đẳng cấp — Đầu ra chất lượng cao nhất. Sử dụng cho các tài sản chính, các bản render cuối cùng và các công việc đối với khách hàng.

Bạn sẽ thấy mô hình nào được chọn và có thể chuyển sang một mô hình khác bất kỳ lúc nào bằng cách nhấp vào “Thay đổi mô hình / Nâng cao”. Đối với các lần tạo nội dung độc lập bên ngoài các dự án, bạn tự chọn mô hình.

Studio Hình ảnh

Studio Hình ảnh là không gian làm việc đa năng nhất, hỗ trợ hai chế độ chính:

  • Văn bản sang hình ảnh — Mô tả những gì bạn muốn trong một lời nhắc văn bản. Hãy cụ thể về phong cách, cấu trúc, ánh sáng, khí hậu và nội dung để đạt được kết quả tốt nhất.
  • Hình ảnh sang hình ảnh — Cung cấp một hình ảnh tham khảo cùng với một lời nhắc. AI sử dụng hình ảnh tham khảo làm điểm xuất phát và biến đổi nó theo hướng dẫn của bạn. Điều chỉnh tham số mạnh để kiểm soát mức độ xuất phát của đầu ra so với đầu vào.

Các tham số phổ biến bao gồm tỷ lệ khung hình (chân dung, cảnh quan, vuông và tùy chỉnh), mức độ chất lượng, hạt giống (để có kết quả tái sản xuất được) và lời nhắc tiêu cực (để loại trừ các yếu tố không mong muốn). Không tất cả các tham số đều có sẵn trên mỗi mô hình — biểu mẫu tự động thích ứng với khả năng của mỗi mô hình.

Studio Video

Studio Video hỗ trợ nhiều chế độ tạo nội dung cho các nhu cầu sáng tạo khác nhau:

  • Văn bản sang video — Tạo một clip video trực tiếp từ một mô tả văn bản. Tốt nhất cho các khái niệm nhanh và nghiên cứu chuyển động.
  • Hình ảnh sang video — Hoạt hóa một khung hình tĩnh đã được phê duyệt thành video. Đây là quy trình làm việc được khuyến nghị cho đầu ra chất lượng sản xuất: tạo và phê duyệt một khung hình trong Studio Hình ảnh trước, rồi mang nó đến Studio Video.
  • Mở rộng video — Mở rộng một clip video hiện có với các khung hình bổ sung, tiếp tục động tác và câu chuyện.
  • Chuyển đổi video — Áp dụng các thay đổi phong cách cho một video hiện có trong khi giữ nguyên động tác và cấu trúc của nó.
  • Hiệu ứng hình ảnh — Thêm các hiệu ứng VFX, chuyển tiếp và hiệu ứng phong cách cho các clip video.
  • Hoạt hình nhân vật — Hoạt hình nhân vật với động tác, biểu cảm và cử chỉ từ đầu vào văn bản hoặc âm thanh.

Quan trọng: Đối với hình ảnh sang video, hình ảnh nguồn phải được phê duyệt trước. Điều này đảm bảo bạn đang đầu tư video credit vào một khung hình bạn hài lòng. Phê duyệt bất kỳ hình ảnh nào từ giao diện chi tiết hoặc bảng xem lại.

Các tùy chọn thời lượng khác nhau tùy theo mô hình. Mỗi mô hình hỗ trợ các độ dài clip cụ thể:

  • Veo 3.1 — 4, 6, hoặc 8 giây
  • Kling 2.6 Pro — 5 hoặc 10 giây
  • Hailuo 2.3 — 6 hoặc 10 giây
  • WAN 2.6 — 5, 10, hoặc 15 giây

Khi làm việc trong một dự án, thời lượng các cảnh được lên kế hoạch trước sử dụng các giá trị này. Thời lượng bạn chọn tại thời điểm tạo nên nên khớp với thời lượng cảnh đã lên kế hoạch để đảm bảo nhịp độ nhất quán trong sản xuất của bạn.

Xưởng Âm Thanh

Tạo âm thanh nói và hiệu ứng âm thanh với AI:

  • Văn bản sang âm thanh — Chuyển đổi văn bản viết thành âm thanh nghe tự nhiên. Chọn từ nhiều giọng nói khác nhau với các giọng địa phương, giới tính và chất giọng khác nhau. Điều chỉnh tốc độ và nhấn mạnh để đạt được hiệu quả bạn cần.
  • Hiệu ứng âm thanh — Mô tả một âm thanh môi trường, hiệu ứng foley, hoặc chất âm thanh và AI sẽ tạo ra nó. Hữu ích cho việc thêm bầu không khí cho các dự án video.

Các định dạng xuất bao gồm MP3 và WAV. Các tài sản âm thanh tích hợp trực tiếp vào thời gian dự án của bạn cùng với các tài sản hình ảnh.

Xưởng Âm Nhạc

Tạo các bản nhạc và âm nhạc gốc:

  • Văn bản sang âm nhạc — Mô tả cảm xúc, thể loại, nhịp độ và nhạc cụ bạn muốn. AI tạo ra một bản nhạc gốc.
  • Âm thanh sang âm nhạc — Cung cấp một clip âm thanh tham khảo và AI tạo ra âm nhạc phù hợp với phong cách, nhịp độ hoặc cảm xúc của nó.

Các tài sản âm nhạc rất tốt cho việc âm nhạc cho các dự án video, tạo các bản nhạc nền cho podcast, hoặc tạo âm nhạc miễn phí bản quyền cho nội dung.

Xưởng 3D

Tạo các đối tượng 3D từ mô tả văn bản hoặc hình ảnh tham khảo:

  • Văn bản sang 3D — Mô tả một đối tượng và AI tạo ra một mô hình 3D có texture.
  • Hình ảnh sang 3D — Cung cấp một hình ảnh tham khảo và AI suy luận cấu trúc 3D và tạo ra một mô hình phù hợp với nó.

Các định dạng xuất bao gồm GLB và OBJ, sẵn sàng để nhập vào các engine game (Unity, Unreal), trình chỉnh sửa 3D (Blender), ứng dụng AR/VR, và trình xem web.

Xưởng Avatar

Tạo hoạt hình nhân vật và video nói đầu:

  • Phát âm — Cung cấp một hình ảnh chân dung và một bản ghi âm. AI hoạt hình khuôn mặt phù hợp với lời nói, tạo ra một video nói đầu thực tế.
  • Hoạt hình khuôn mặt — Hoạt hình biểu cảm khuôn mặt và động tác đầu trên một hình ảnh chân dung từ một video tham khảo hoặc đầu vào âm thanh.
  • Hoán đổi khuôn mặt — Chuyển một khuôn mặt sang một khuôn mặt khác trong video hoặc hình ảnh, giữ lại động tác và biểu cảm ban đầu.
  • Chuyển đổi chân dung — Áp dụng phong cách hoặc tương đồng của một chân dung trong các bối cảnh và tư thế khác nhau.

Mô hình avatar hoạt động tốt nhất với hình ảnh tham khảo rõ ràng, hướng mặt trước và đầu vào âm thanh chất lượng cao cho việc đồng bộ môi.

Tiến trình ống dẫn

Khi tạo trong một dự án, một thanh tiến trình sẽ hiển thị ống dẫn sản xuất cho mỗi cảnh: Hình ảnh → Video → Âm thanh. Các giai đoạn hoàn thành được đánh dấu bằng một dấu tích, và bạn có thể nhấp vào bất kỳ giai đoạn nào để chuyển sang không gian làm việc đó. Mỗi quá trình tạo hoạt động hiển thị thời gian đã trôi qua để bạn luôn biết nó đã chạy bao lâu.

Tối ưu hóa lời nhắc tự động

Khi sử dụng Pixel Agent (Chế độ Hướng dẫn hoặc Tự động), các lời nhắc cảnh của bạn sẽ được cải thiện tự động trước khi cố gắng tạo lần đầu tiên. Bộ tối ưu hóa thêm các thuật ngữ chụp ảnh kỹ thuật, chi tiết về ánh sáng và hướng dẫn về cấu trúc hình ảnh mà các mô hình hình ảnh phản ứng tốt nhất.

Điều này xảy ra ở phía sau màn hình — bạn không cần viết các lời nhắc hoàn hảo. Lời nhắc gốc được giữ lại; phiên bản đã tối ưu hóa chỉ được sử dụng cho việc tạo. Nếu quá trình tối ưu hóa thất bại vì bất kỳ lý do gì, lời nhắc gốc sẽ được sử dụng như vậy để không chặn sản xuất.

Đánh giá chất lượng

Sau khi tạo mỗi hình ảnh thông qua Pixel Agent, một mô hình thị giác AI sẽ đánh giá kết quả so với lời nhắc gốc của bạn. Nó đánh giá bốn chiều:

  • Tuân theo lời nhắc — Hình ảnh có khớp với mô tả không?
  • Cấu trúc — Khung, cân bằng và luồng hình ảnh mạnh mẽ không?
  • Chất lượng kỹ thuật — Độ sắc nét, ánh sáng, độ chính xác màu sắc.
  • Cảm xúc — Cảm xúc của hình ảnh có khớp với bối cảnh cảnh không?

Điểm tổng hợp (1-10) được so sánh với ngưỡng chất lượng của bạn. Các hình ảnh vượt qua được chấp thuận. Các hình ảnh không vượt qua được thử lại với một lời nhắc được tinh chỉnh để giải quyết các vấn đề cụ thể được tìm thấy. Mỗi cảnh được thử lại tối đa hai lần về chất lượng trước khi tự động chấp thuận để duy trì sản xuất.

Mẹo về lời nhắc

Chất lượng của đầu ra phụ thuộc rất nhiều vào lời nhắc của bạn. Đây là một số mẹo áp dụng cho tất cả các studio:

  • Được cụ thể — Thay vì “một con mèo,” hãy thử “một con mèo lông tabby ngồi trên cửa sổ, ánh sáng chiều, nền mờ mờ bokeh, chân thực như ảnh chụp.”
  • Mô tả phong cách và cảm xúc — Bao gồm phong cách nghệ thuật (điện ảnh, anime, nước màu), ánh sáng (giờ vàng, ánh sáng studio, neon) và cảm xúc (thanh bình, kịch tính, vui vẻ).
  • Sử dụng lời nhắc tiêu cực — Nếu được hỗ trợ, lời nhắc tiêu cực loại trừ các yếu tố không mong muốn (ví dụ: “làm mờ, chất lượng thấp, văn bản, dấu nước”).
  • Lặp lại với mô hình ngân sách — Tinh chỉnh lời nhắc của bạn bằng các mô hình nhanh, chi phí thấp. Khi bạn hài lòng với cấu trúc và phong cách, chuyển sang mô hình cao cấp để tạo bản vẽ cuối cùng.
  • Sử dụng bộ tối ưu hóa lời nhắc — Bộ tối ưu hóa lời nhắc AI tích hợp lại viết lại lời nhắc của bạn để chi tiết hơn và thân thiện với mô hình. Nó thêm các tham số kỹ thuật để cải thiện chất lượng đầu ra.
  • Sử dụng hạt giống để đảm bảo nhất quán — Nếu bạn tìm thấy kết quả bạn thích, ghi lại giá trị hạt giống của nó. Sử dụng cùng một hạt giống với cùng một lời nhắc sẽ tạo ra đầu ra tương tự, cho phép bạn thực hiện các thay đổi nhỏ trong lời nhắc trong khi giữ nguyên cấu trúc hình ảnh chung.

Tạo song song

Bạn có thể gửi nhiều công việc tạo cùng một lúc. Mỗi gói bao gồm một giới hạn đồng thời — số lượng công việc có thể chạy đồng thời:

  • Miễn phí — 4 nhiệm vụ song song
  • Bắt đầu — 6 nhiệm vụ song song
  • Tạo & Pro — 8 nhiệm vụ song song
  • Studio — 12 nhiệm vụ song song

Các công việc từ các studio khác nhau có thể chạy cùng một lúc — tạo một hình ảnh trong khi một video được tạo, hoặc sản xuất âm thanh trong khi một mô hình 3D đang được tạo.

Trên bảng câu chuyện, nút Tạo tất cả sẽ hiển thị số lượng slot song song có sẵn để bạn biết bao nhiêu cảnh sẽ bắt đầu ngay lập tức. Khi bạn đạt đến giới hạn, các cảnh còn lại sẽ bắt đầu khi các slot được giải phóng. Để tăng giới hạn song song, nâng cấp gói của bạn.

Câu hỏi thường gặp

Cách thức chọn mô hình tự động hoạt động như thế nào?

Khi bạn đang làm việc trong một dự án, AI sẽ phân tích cảnh của bạn — các tham chiếu liên kết, loại cảnh và chuyển động của camera — và tự động chọn mô hình tốt nhất. Bạn có thể chuyển sang mô hình khác bất kỳ lúc nào bằng cách nhấp vào 'Thay đổi mô hình / Cấp cao'.

Tôi có thể tạo nhiều tài sản cùng một lúc không?

Có. Bạn có thể gửi nhiều công việc song song lên đến giới hạn đồng thời của gói của bạn. Mỗi công việc chạy độc lập, vì vậy bạn có thể làm việc trên nhiều studio cùng một lúc.

Tại sao video cần phải được phê duyệt khung hình?

Phê duyệt khung hình trước tiên đảm bảo bạn hài lòng với hướng đi hình ảnh trước khi tiêu thụ tín dụng cho quá trình tạo video đắt tiền hơn. Điều này ngăn ngừa việc tiêu thụ tín dụng không cần thiết cho video từ khung hình bạn sẽ từ chối.

Tôi cần phải viết các lời mời không?

Không. Khi làm việc trong một dự án, các lời mời được tạo tự động từ mô tả cảnh của bạn, ngữ cảnh cảnh và các tham chiếu liên kết. Đối với các tạo độc lập, bạn viết một mô tả và bộ tối ưu hóa tích hợp sẽ cải thiện nó để đạt kết quả tốt hơn.

Tôi có thể truy cập các thiết lập nâng cao không?

Có. Nhấp vào 'Thay đổi mô hình / Cấp cao' để truy cập thư viện mô hình đầy đủ, điều chỉnh các tham số như tỷ lệ khung hình và thời lượng, và điều chỉnh mọi chi tiết. Chế độ nâng cao cho bạn quyền kiểm soát hoàn toàn.

Tôi có thể tạo cảnh trực tiếp từ bảng câu chuyện không?

Có. Nhấp vào bất kỳ thẻ cảnh trống nào trên bảng câu chuyện để mở một modal sản xuất hướng dẫn mà sẽ dẫn bạn qua quá trình tạo khung hình, xem xét và tạo video — tất cả mà không rời khỏi bảng câu chuyện. Sử dụng "Tạo tất cả" để tạo nhiều cảnh cùng một lúc.

Pixel Agent có tối ưu hóa lời mời của tôi không?

Có. Trong lần thử đầu tiên cho mỗi cảnh, agent sẽ cải thiện lời mời của bạn với các thuật ngữ chụp ảnh kỹ thuật, chi tiết về ánh sáng và hướng dẫn về cấu trúc hình ảnh. Điều này xảy ra tự động — lời mời gốc của bạn được lưu giữ và phiên bản cải tiến được sử dụng cho quá trình tạo.

Điều gì xảy ra khi cổng kiểm soát chất lượng từ chối một hình ảnh?

Người đánh giá AI cung cấp một lời mời tinh chỉnh mà giải quyết các vấn đề cụ thể mà nó tìm thấy (ví dụ: hướng ánh sáng tốt hơn, cấu trúc hình ảnh cải thiện). Agent thử lại với lời mời tinh chỉnh này. Sau hai lần thử lại chất lượng, hình ảnh được tự động phê duyệt để sản xuất tiếp tục tiến hành.

Sẵn sàng tạo ra?

Thử mỗi studio miễn phí — hình ảnh, video, âm thanh, 3D và avatar.

Bắt đầu Miễn Phí