जनरेशन गाइड
प्रत्येक वर्कस्पेस में महारत हासिल करें — टेक्स्ट-टू-इमेज से 3D ऑब्जेक्ट तक।
जनरेशन कैसे काम करता है
Gizmoji पर हर जनरेशन एक सरल फ्लो का पालन करता है:
- एक स्टूडियो का चयन करें (इमेज, वीडियो, ऑडियो, संगीत, 3D, या अवतार)।
- जनरेशन पर क्लिक करें — AI स्वचालित रूप से सबसे अच्छा मॉडल चुनता है और आपकी शॉट कंटेक्स्ट के आधार पर सबसे अच्छे सेटिंग्स भरता है। क्रेडिट्स प्री-होल्ड किए जाते हैं और जॉब क्यू में जाता है।
- अपनी संपत्ति बनाई जा रही है, इसके साथ-साथ गुजरे हुए समय को दिखाते हुए रियल-टाइम प्रोग्रेस इंडिकेटर देखें।
- नतीजे को डाउनलोड, इटरेट, या अप्रूव करें।
क्या आप एक विशिष्ट मॉडल चुनना या सेटिंग्स समायोजित करना चाहते हैं? पूर्ण मॉडल लाइब्रेरी और सभी पैरामीटर्स तक पहुंचने के लिए “Change model / Advanced” पर क्लिक करें।
अगर किसी भी कारण से एक जॉब फेल हो जाता है, तो आपकी क्रेडिट्स पूर्ण रूप से स्वचालित रूप से रिफंड की जाती हैं।
स्वचालित मॉडल चयन
एक प्रोजेक्ट के अंदर काम करते समय, Gizmoji हर शॉट के लिए सबसे अच्छा मॉडल चुनता है, जो आपकी रेफरेंस पर आधारित है जो आपने लिंक किए हैं, शॉट प्रकार, कैमरा मूवमेंट, और विज़ुअल स्टाइल। AI तीन प्राइसिंग टीयर्स से चुनता है:
- बजट — तेज़ और सस्ता। ड्राफ्टिंग, इटरेशन, और विचार तेज़ी से खोजने के लिए आदर्श।
- मूल्य — गुणवत्ता और लागत का संतुलन। अधिकांश उत्पादन कार्य के लिए सबसे अच्छा।
- प्रीमियम — उच्चतम गुणवत्ता आउटपुट। हीरो संपत्तियों, अंतिम रेंडर्स, और क्लाइंट-फेसिंग कार्य के लिए उपयोग करें।
आप देखेंगे कि किस मॉडल का चयन किया गया है और किसी भी समय एक अलग मॉडल पर स्विच कर सकते हैं “Change model / Advanced” पर क्लिक करके। स्टैंडअलोन जनरेशन्स के लिए प्रोजेक्ट्स के बाहर, आप खुद मॉडल चुनते हैं।
इमेज स्टूडियो
इमेज स्टूडियो सबसे बहुमुखी वर्कस्पेस है, जो दो प्राथमिक मोड्स का समर्थन करता है:
- टेक्स्ट-टू-इमेज — एक टेक्स्ट प्रॉम्प्ट में लिखें कि आप क्या चाहते हैं। स्टाइल, कम्पोजिशन, लाइटिंग, मूड, और सब्जेक्ट मैटर के बारे में विशिष्ट रहें सबसे अच्छे परिणामों के लिए।
- इमेज-टू-इमेज — एक रेफरेंस इमेज के साथ एक प्रॉम्प्ट प्रदान करें। AI रेफरेंस को एक स्टार्टिंग पॉइंट के रूप में उपयोग करता है और इसे आपके निर्देशों के अनुसार बदलता है। आउटपुट को इनपुट से कितना अलग होता है, इस पर नियंत्रण करने के लिए स्ट्रेंथ पैरामीटर समायोजित करें।
सामान्य पैरामीटर्स में एस्पेक्ट रेशियो (पोर्ट्रेट, लैंडस्केप, स्क्वायर, और कस्टम), गुणवत्ता स्तर, सीड (पुनरुत्पादित परिणामों के लिए), और नकारात्मक प्रॉम्प्ट्स (अनचाहे तत्वों को बाहर करने के लिए) शामिल हैं। हर मॉडल पर सभी पैरामीटर्स उपलब्ध नहीं होते — फॉर्म हर मॉडल की क्षमताओं के अनुसार स्वचालित रूप से अनुकूलित होता है।
वीडियो स्टूडियो
वीडियो स्टूडियो विभिन्न क्रिएटिव आवश्यकताओं के लिए कई जनरेशन मोड्स का समर्थन करता है:
- टेक्स्ट-टू-वीडियो — एक टेक्स्ट वर्णन से सीधे एक वीडियो क्लिप जनरेट करें। तेज़ कॉन्सेप्ट्स और मोशन स्टडीज़ के लिए सबसे अच्छा।
- इमेज-टू-वीडियो — एक अप्रूव्ड स्टिल फ्रेम को एक वीडियो में एनिमेट करें। यह उत्पादन-गुणवत्ता आउटपुट के लिए अनुशंसित वर्कफ्लो है: पहले इमेज स्टूडियो में एक फ्रेम जनरेट और अप्रूव करें, फिर इसे वीडियो स्टूडियो में लाएं।
- वीडियो विस्तार — एक मौजूदा वीडियो क्लिप को अतिरिक्त फ्रेम्स के साथ बढ़ाएं, गति और कहानी को जारी रखते हुए।
- वीडियो ट्रांसफॉर्म — एक मौजूदा वीडियो में स्टाइल बदलाव लागू करें जबकि इसकी गति और संरचना को बनाए रखें।
- विज़ुअल इफेक्ट्स — वीडियो क्लिप्स में VFX उपचार, संक्रमण और शैलीगत प्रभाव जोड़ें।
- कैरेक्टर एनिमेशन — पाठ या ऑडियो इनपुट से कैरेक्टर को गति, अभिव्यक्ति और हाव-भाव के साथ एनिमेट करें।
महत्वपूर्ण: छवि से वीडियो के लिए, स्रोत छवि को पहले मंजूर करना होगा। इससे यह सुनिश्चित होता है कि आप एक फ्रेम में वीडियो क्रेडिट्स निवेश कर रहे हैं जिसे आप पसंद करते हैं। किसी भी छवि को उसके विवरण दृश्य या समीक्षा पैनल से मंजूर करें।
ड्यूरेशन विकल्प मॉडल के अनुसार भिन्न होते हैं। हर मॉडल विशिष्ट क्लिप लंबाई का समर्थन करता है:
- Veo 3.1 — 4, 6, या 8 सेकंड
- Kling 2.6 Pro — 5 या 10 सेकंड
- Hailuo 2.3 — 6 या 10 सेकंड
- WAN 2.6 — 5, 10, या 15 सेकंड
एक परियोजना के भीतर काम करते समय, शॉट ड्यूरेशन इन मानों का उपयोग करके पूर्व-योजना बनाई जाती है। जनरेशन समय पर आपने चुना हुआ ड्यूरेशन योजना किए गए शॉट ड्यूरेशन के साथ मेल खाना चाहिए ताकि आपकी उत्पादन के दौरान एकसंगति गति हो।
ऑडियो स्टूडियो
AI के साथ बोलने वाली ऑडियो और साउंड इफेक्ट्स बनाएं:
- पाठ से भाषण — लिखित पाठ को स्वाभाविक ध्वनि वाले भाषण में बदलें। विभिन्न आवाजों में से चुनें जिनमें अलग-अलग अक्सेंट, लिंग और टोन गुण होते हैं। आपकी आवश्यकता के अनुसार गति और जोर को समायोजित करें।
- साउंड इफेक्ट्स — एक एंबिएंट ध्वनि, फोली इफेक्ट, या ऑडियो टेक्सचर का वर्णन करें और AI इसे जनरेट करता है। वीडियो परियोजनाओं में वातावरण जोड़ने के लिए उपयोगी।
आउटपुट फॉर्मेट में MP3 और WAV शामिल हैं। ऑडियो संपत्ति सीधे आपकी परियोजना टाइमलाइन में दृश्य संपत्तियों के साथ एकीकृत होती हैं।
म्यूजिक स्टूडियो
मूल संगीत ट्रैक्स और स्कोर बनाएं:
- पाठ से संगीत — वह मूड, जीनर, टेम्पो और इंस्ट्रूमेंटेशन का वर्णन करें जो आप चाहते हैं। AI एक मूल इंस्ट्रूमेंटल ट्रैक जनरेट करता है।
- ऑडियो से संगीत — एक रेफरेंस ऑडियो क्लिप प्रदान करें और AI उस शैली, टेम्पो, या मूड के साथ मेल खाने वाले संगीत का जनरेशन करता है।
म्यूजिक संपत्ति वीडियो परियोजनाओं के लिए स्कोरिंग, पॉडकास्ट्स के लिए बैकग्राउंड ट्रैक्स बनाने या सामग्री के लिए रॉयल्टी-फ्री संगीत जनरेट करने के लिए अच्छी हैं।
3D स्टूडियो
पाठ वर्णन या रेफरेंस छवियों से 3D ऑब्जेक्ट बनाएं:
- पाठ से 3D — एक ऑब्जेक्ट का वर्णन करें और AI एक टेक्सचर्ड 3D मॉडल जनरेट करता है।
- छवि से 3D — एक रेफरेंस छवि प्रदान करें और AI 3D संरचना का अनुमान लगाता है और एक मॉडल जनरेट करता है जो इसके साथ मेल खाता है।
आउटपुट फॉर्मेट में GLB और OBJ शामिल हैं, जो गेम इंजन (यूनिटी, अनरियल), 3D एडिटर (ब्लेंडर), AR/VR एप्लिकेशन्स, और वेब व्यूअर्स में आयात के लिए तैयार हैं।
एवटार स्टूडियो
कैरेक्टर एनिमेशन और टॉकिंग-हेड वीडियो बनाएं:
- लिप-सिंक — एक पोर्ट्रेट छवि और एक ऑडियो ट्रैक प्रदान करें। AI चेहरे को भाषण के साथ मेल खाने के लिए एनिमेट करता है, एक वास्तविक टॉकिंग-हेड वीडियो उत्पन्न करता है।
- फेस एनिमेशन — एक रेफरेंस वीडियो या ऑडियो इनपुट से एक पोर्ट्रेट छवि पर चेहरे की अभिव्यक्तियों और सिर की गतियों को एनिमेट करें।
- फेस स्वैप — एक वीडियो या छवि में एक चेहरे को दूसरे पर स्थानांतरित करें, मूल गति और अभिव्यक्तियों को बनाए रखते हुए।
- पोर्ट्रेट ट्रांसफर — एक पोर्ट्रेट की शैली या समानता को विभिन्न संदर्भों और मुद्राओं में लागू करें।
एवतार मॉडल्स स्पष्ट, फ्रंट-फेसिंग रेफरेंस इमेज और लिप-सिंक के लिए उच्च गुणवत्ता वाले ऑडियो इनपुट के साथ सबसे अच्छी तरह काम करते हैं।
पाइपलाइन प्रगति
एक प्रोजेक्ट के भीतर जनरेट करते समय, एक प्रगति स्ट्रिप हर शॉट के लिए उत्पादन पाइपलाइन दिखाती है: इमेज → वीडियो → ऑडियो। पूर्ण चरणों को एक चेकमार्क से चिह्नित किया जाता है, और आप किसी भी चरण पर क्लिक कर सकते हैं ताकि उस वर्कस्पेस पर स्विच कर सकें। हर सक्रिय जनरेशन चलने के समय को दिखाता है ताकि आप हमेशा जान सकें कि यह कितने समय से चल रहा है।
स्वचालित प्रॉम्प्ट अनुकूलन
पिक्सेल एजेंट (गाइडेड या ऑटो मोड) का उपयोग करते समय, आपका शॉट प्रॉम्प्ट पहले जनरेशन प्रयास से पहले स्वचालित रूप से सुधारा जाता है। ऑप्टिमाइज़र उन तकनीकी फोटोग्राफी शब्दों, लाइटिंग विशिष्टताओं और कम्पोजिशन गाइडेंस को जोड़ता है जिनके प्रति इमेज मॉडल सबसे अच्छी तरह प्रतिक्रिया करते हैं।
यह पृष्ठभूमि में होता है — आपको खुद को पूर्ण प्रॉम्प्ट लिखने की आवश्यकता नहीं है। मूल प्रॉम्प्ट संरक्षित रहता है; अनुकूलित संस्करण केवल जनरेशन के लिए उपयोग किया जाता है। अगर किसी भी कारण से अनुकूलन विफल हो जाता है, तो मूल प्रॉम्प्ट जैसा है, उपयोग किया जाता है ताकि उत्पादन कभी भी रोक न दिया जाए।
गुणवत्ता मूल्यांकन
पिक्सेल एजेंट के माध्यम से हर छवि उत्पन्न होने के बाद, एक AI विजन मॉडल परिणाम को आपके मूल प्रॉम्प्ट के खिलाफ मूल्यांकन करता है। यह चार आयामों का स्कोर करता है:
- प्रॉम्प्ट अनुपालन — क्या छवि उस चीज को दर्शाती है जो वर्णित की गई थी?
- कम्पोजिशन — क्या फ्रेमिंग, बैलेंस और विजुअल फ्लो मजबूत है?
- तकनीकी गुणवत्ता — स्पष्टता, प्रकाश, रंग की सटीकता।
- मूड — क्या भावनात्मक टोन दृश्य संदर्भ के साथ मेल खाता है?
संयुक्त स्कोर (1-10) को आपकी गुणवत्ता थ्रेशहोल्ड के खिलाफ तुलना की जाती है। छवियाँ जो पास होती हैं, उन्हें मंजूरी दी जाती है। छवियाँ जो नहीं पास होती हैं, उन्हें एक सुधारे गए प्रॉम्प्ट के साथ फिर से प्रयास किया जाता है जो पाए गए विशिष्ट समस्याओं को संबोधित करता है। हर शॉट को दो गुणवत्ता रिट्राइज से पहले स्वचालित रूप से मंजूरी दी जाती है ताकि उत्पादन चलता रहे।
प्रॉम्प्टिंग टिप्स
आपके आउटपुट की गुणवत्ता आपकी प्रॉम्प्ट पर बहुत अधिक निर्भर करती है। यहां कुछ टिप्स हैं जो सभी स्टूडियो में लागू होते हैं:
- विशिष्ट हों — “एक बिल्ली” के बजाय, “एक टैबी बिल्ली विंडो सिल पर बैठी, दोपहर का धूप, सॉफ्ट बोकेह पृष्ठभूमि, फोटोरियलिस्टिक” का प्रयास करें।
- शैली और मूड का वर्णन करें — कला शैली (सिनेमाई, एनिमे, वॉटरकलर), प्रकाश (गोल्डन आवर, स्टूडियो प्रकाश, नीयन), और मूड (शांत, ड्रामैटिक, खेलनशील) शामिल करें।
- नेगेटिव प्रॉम्प्ट का उपयोग करें — जहां समर्थित हो, नेगेटिव प्रॉम्प्ट अनचाहे तत्वों को बाहर करते हैं (उदाहरण के लिए, “धुंधला, कम गुणवत्ता, पाठ, वॉटरमार्क”)।
- बजट मॉडल के साथ इटरेट करें — अपने प्रॉम्प्ट को तेज, कम लागत वाले मॉडल का उपयोग करके सुधारें। जब आप कम्पोजिशन और शैली से संतुष्ट हो जाएं, तो अंतिम रेंडर के लिए एक प्रीमियम मॉडल पर स्विच करें।
- प्रॉम्प्ट ऑप्टिमाइज़र का उपयोग करें — बिल्ट-इन AI प्रॉम्प्ट ऑप्टिमाइज़र आपकी प्रॉम्प्ट को अधिक विस्तृत और मॉडल-अनुकूल लिखता है। यह आउटपुट गुणवत्ता को सुधारने वाले तकनीकी पैरामीटर जोड़ता है।
- संगतता के लिए सीड्स का उपयोग करें — अगर आप एक परिणाम पसंद करते हैं, तो इसके सीड वैल्यू का नोट करें। उसी सीड और प्रॉम्प्ट का उपयोग करके समान आउटपुट उत्पन्न होता है, जिससे आप छोटे प्रॉम्प्ट ट्विक्स कर सकते हैं जबकि समग्र कम्पोजिशन को बनाए रखते हैं।
समानांतर जनरेशन
आप एक साथ कई जनरेशन जॉब सबमिट कर सकते हैं। हर प्लान टियर में एक कंकरीसी लिमिट शामिल है — एक साथ चलने वाले जॉब की संख्या:
- फ्री — 4 समानांतर टास्क
- स्टार्टर — 6 समानांतर टास्क
- क्रिएटर और प्रो — 8 समानांतर टास्क
- स्टूडियो — 12 समानांतर टास्क
अलग स्टूडियो से जॉब एक साथ चल सकते हैं — एक छवि उत्पन्न करते समय एक वीडियो रेंडर हो रहा है, या एक 3D मॉडल बनाया जा रहा है जबकि ऑडियो उत्पन्न हो रहा है।
स्टोरीबोर्ड पर, प्रोड्यूस ऑल बटन दिखाता है कि कितने पैरालेल स्लॉट उपलब्ध हैं ताकि आप जान सकें कि कितने शॉट तुरंत शुरू होंगे। जब आप सीमा तक पहुंचते हैं, तो शेष शॉट स्लॉट खाली होने पर शुरू होते हैं। अपने पैरालेल सीमा बढ़ाने के लिए, अपने प्लान को अपग्रेड करें।
अक्सर पूछे जाने वाले प्रश्न
स्वचालित मॉडल चयन कैसे काम करता है?
जब आप एक प्रोजेक्ट के अंदर काम कर रहे होते हैं, तो AI आपकी शॉट का विश्लेषण करता है — लिंक किए गए रेफरेंस, शॉट प्रकार, और कैमरा मूवमेंट — और सबसे अच्छा मॉडल स्वचालित रूप से चुनता है। आप हमेशा 'मॉडल बदलें / एडवांस्ड' क्लिक करके एक अलग मॉडल पर स्विच कर सकते हैं।
क्या मैं एक साथ कई एसेट्स उत्पन्न कर सकता हूँ?
हाँ। आप अपने प्लान की समांतरता सीमा तक कई जॉब्स को समांतर रूप से सबमिट कर सकते हैं। हर जॉब स्वतंत्र रूप से चलता है, इसलिए आप स्टूडियो के बीच काम कर सकते हैं।
विडियो के लिए एक मंजूर फ्रेम की क्यों आवश्यकता होती है?
पहले एक फ्रेम को मंजूर करना सुनिश्चित करता है कि आप वीडियो जनरेशन पर क्रेडिट खर्च करने से पहले दृश्य दिशा से खुश हैं। यह क्रेडिट को उन वीडियो पर खर्च होने से बचाता है जो फ्रेम्स से अस्वीकृत होंगे।
क्या मुझे प्रॉम्प्ट्स लिखने की आवश्यकता है?
नहीं। जब आप एक प्रोजेक्ट के अंदर काम कर रहे होते हैं, तो प्रॉम्प्ट्स स्वचालित रूप से आपकी शॉट विवरण, दृश्य संदर्भ, और लिंक किए गए रेफरेंस से उत्पन्न होते हैं। स्टैंडअलोन जनरेशन के लिए, आप एक विवरण लिखते हैं और बिल्ट-इन ऑप्टिमाइज़र इसे बेहतर परिणामों के लिए बढ़ाता है।
क्या मैं एडवांस्ड सेटिंग्स तक पहुंच सकता हूँ?
हाँ। 'मॉडल बदलें / एडवांस्ड' क्लिक करके आप पूरे मॉडल लाइब्रेरी तक पहुंच सकते हैं, पैरामीटर्स जैसे एस्पेक्ट रेशियो और ड्यूरेशन को समायोजित कर सकते हैं, और हर विवरण को फाइन-ट्यून कर सकते हैं। एडवांस्ड मोड आपको पूर्ण नियंत्रण देता है।
क्या मैं स्टोरीबोर्ड से सीधे शॉट्स उत्पन्न कर सकता हूँ?
हाँ। स्टोरीबोर्ड पर किसी भी खाली शॉट कार्ड पर क्लिक करें ताकि एक गाइडेड प्रोडक्शन मॉडल खुल सके जो आपको फ्रेम जनरेशन, समीक्षा, और वीडियो प्रोडक्शन के माध्यम से ले जाता है — स्टोरीबोर्ड छोड़ने के बिना। "सभी उत्पन्न करें" का उपयोग करके एक साथ कई शॉट्स को बैच-उत्पन्न करें।
क्या पिक्सेल एजेंट मेरे प्रॉम्प्ट्स को ऑप्टिमाइज़ करता है?
हाँ। हर शॉट के लिए पहले प्रयास पर, एजेंट आपकी प्रॉम्प्ट को तकनीकी फोटोग्राफी शब्दों, लाइटिंग विवरण, और संरचना मार्गदर्शन के साथ बढ़ाता है। यह स्वचालित रूप से होता है — आपकी मूल प्रॉम्प्ट संरक्षित रहती है और बढ़ाया हुआ संस्करण जनरेशन के लिए उपयोग किया जाता है।
एक छवि को रिजेक्ट करने पर क्या होता है?
AI मूल्यांकनकर्ता एक सुधारी हुई प्रॉम्प्ट प्रदान करता है जो विशेष समस्याओं को संबोधित करता है (जैसे, बेहतर लाइटिंग दिशा, सुधारी हुई संरचना)। एजेंट इस सुधारी हुई प्रॉम्प्ट के साथ पुन: प्रयास करता है। दो गुणवत्ता पुन: प्रयासों के बाद, छवि स्वचालित रूप से मंजूर कर दी जाती है ताकि उत्पादन चलता रहे।
उत्पन्न करने के लिए तैयार?
हर स्टूडियो को फ्री में ट्राई करें — छवि, वीडियो, ऑडियो, 3डी, और अवतार।
फ्री शुरू करें