Technology

वॉइस क्लोनिंग स्टार्टअप इलेवनलैब्स ने $80 मिलियन की कमाई की, यूनिकॉर्न का दर्जा हासिल किया | टेकक्रंच


वॉइस क्लोनिंग में बहुत पैसा है।

इसका स्पष्ट उदहारण: इलेवनलैब्ससिंथेटिक आवाज़ें बनाने और संपादित करने के लिए एआई-संचालित टूल विकसित करने वाले एक स्टार्टअप ने आज घोषणा की कि उसने आंद्रेसेन होरोविट्ज़, पूर्व गिटहब सीईओ नैट फ्रीडमैन और उद्यमी डैनियल ग्रॉस सहित प्रमुख निवेशकों के सह-नेतृत्व में $80 मिलियन सीरीज़ बी राउंड को बंद कर दिया है।

राउंड, जिसमें सिकोइया कैपिटल, स्मैश कैपिटल, एसवी एंजेल, ब्रॉडलाइट कैपिटल और क्रेडो वेंचर्स की भी भागीदारी थी, इलेवनलैब्स की कुल कमाई $101 मिलियन हो गई और कंपनी का मूल्य $1 बिलियन से अधिक (~$100 मिलियन से अधिक) हो गया। पिछली जून). सीईओ माटी स्टैनिसजेव्स्की का कहना है कि नई नकदी को उत्पाद विकास, इलेवनलैब्स के बुनियादी ढांचे और टीम का विस्तार, एआई अनुसंधान और “एआई प्रौद्योगिकी के जिम्मेदार और नैतिक विकास को सुनिश्चित करने के लिए सुरक्षा उपायों को बढ़ाने” में लगाया जाएगा।

स्टैनिसजेव्स्की ने एक ईमेल साक्षात्कार में टेकक्रंच को बताया, “हमने वॉयस एआई अनुसंधान और उत्पाद परिनियोजन में वैश्विक नेता के रूप में इलेवनलैब्स की स्थिति को मजबूत करने के लिए नया पैसा जुटाया।”

2022 में पूर्व-Google मशीन लर्निंग इंजीनियर पियोट्र डबकोव्स्की और पूर्व पलान्टिर परिनियोजन रणनीतिकार स्टैनिज़ेव्स्की द्वारा सह-स्थापित, इलेवनलैब्स को लगभग एक साल पहले बीटा में लॉन्च किया गया था। स्टैनिसजेव्स्की का कहना है कि वह और डबकोव्स्की, जो पोलैंड में पले-बढ़े थे, खराब डब की गई अमेरिकी फिल्मों से वॉयस क्लोनिंग टूल बनाने के लिए प्रेरित हुए थे। उन्होंने सोचा, एआई बेहतर कर सकता है।

आज, इलेवनलैब्स शायद अपने ब्राउज़र-आधारित स्पीच जेनरेशन ऐप के लिए सबसे ज्यादा जाना जाता है, जो स्वर, भावना, ताल और अन्य प्रमुख मुखर विशेषताओं के लिए समायोज्य टॉगल के साथ जीवंत आवाजें बना सकता है। मुफ़्त में, उपयोगकर्ता पाठ दर्ज कर सकते हैं और कई डिफ़ॉल्ट आवाज़ों में से एक द्वारा उस पाठ को ज़ोर से पढ़े जाने की रिकॉर्डिंग प्राप्त कर सकते हैं। भुगतान करने वाले ग्राहक इलेवनलैब्स की वॉयस क्लोनिंग का उपयोग करके नई शैलियों को तैयार करने के लिए आवाज के नमूने अपलोड कर सकते हैं।

तेजी से, इलेवनलैब्स अपनी स्पीच-जनरेटिंग तकनीक के संस्करणों में निवेश कर रहा है, जिसका उद्देश्य ऑडियोबुक और डबिंग फिल्में और टीवी शो बनाना है, साथ ही गेम और मार्केटिंग एक्टिवेशन के लिए चरित्र आवाजें तैयार करना है।

पिछले साल, कंपनी ने एक “स्पीच टू स्पीच” टूल जारी किया था जो पृष्ठभूमि शोर को स्वचालित रूप से हटाते हुए स्पीकर की आवाज, छंद और स्वर को संरक्षित करने का प्रयास करता है, और – फिल्मों और टीवी शो के मामले में – स्रोत सामग्री के साथ भाषण का अनुवाद और सिंक्रनाइज़ करता है। आने वाले हफ्तों के लिए रोडमैप पर एक नया डबिंग स्टूडियो वर्कफ़्लो है जिसमें ट्रांसक्रिप्ट और अनुवाद बनाने और संपादित करने के लिए टूल और एक सदस्यता-आधारित मोबाइल ऐप है जो इलेवनलैब्स आवाज़ों का उपयोग करके वेबपेजों और टेक्स्ट को बताता है।

इलेवनलैब्स के नवाचारों ने पैराडॉक्स इंटरएक्टिव में स्टार्टअप ग्राहकों को जीत लिया है, गेम डेवलपर जिसकी हालिया परियोजनाओं में सिटीज़: स्काईलाइन्स 2 और स्टेलारिस, और द वाशिंगटन पोस्ट – अन्य प्रकाशन, मीडिया और मनोरंजन कंपनियां शामिल हैं। स्टैनिज़ेव्स्की का दावा है कि इलेवनलैब उपयोगकर्ताओं ने 100 से अधिक वर्षों के ऑडियो के बराबर उत्पन्न किया है और इस प्लेटफ़ॉर्म का उपयोग फॉर्च्यून 500 कंपनियों के 41% कर्मचारियों द्वारा किया जा रहा है।

लेकिन प्रचार पूरी तरह सकारात्मक नहीं रहा है.

कुख्यात संदेश बोर्ड 4chan, जो अपनी षडयंत्रकारी सामग्री के लिए जाना जाता है, इस्तेमाल किया गया अभिनेत्री एम्मा वॉटसन जैसी मशहूर हस्तियों की नकल करके घृणित संदेश साझा करने के लिए इलेवनलैब्स के उपकरण। द वर्ज के जेम्स विंसेंट कुछ ही सेकंड में दुर्भावनापूर्ण रूप से आवाजों को क्लोन करने के लिए इलेवनलैब्स को टैप करने में सक्षम थे, उत्पादक नमूनों में हिंसा की धमकियों से लेकर नस्लवादी और ट्रांसफ़ोबिक टिप्पणियों तक सब कुछ शामिल है। और वोक्स पर, रिपोर्टर जोसेफ कॉक्स दस्तावेज बैंक की प्रमाणीकरण प्रणाली को मूर्ख बनाने के लिए पर्याप्त रूप से विश्वसनीय क्लोन तैयार करना।

जवाब में, इलेवनलैब्स ने बार-बार अपनी सेवा की शर्तों का उल्लंघन करने वाले उपयोगकर्ताओं को जड़ से उखाड़ने का प्रयास किया है, जो दुरुपयोग को प्रतिबंधित करता है, और अपने प्लेटफ़ॉर्म द्वारा बनाए गए भाषण का पता लगाने के लिए एक टूल लॉन्च किया है। स्टैनिज़ेव्स्की का कहना है कि इस साल, इलेवनलैब्स ने अन्य वॉयस-जनरेटिंग एआई मॉडल से ऑडियो को फ़्लैग करने के लिए डिटेक्शन टूल को बेहतर बनाने और टूल को तीसरे पक्ष के प्लेटफ़ॉर्म पर उपलब्ध कराने के लिए अनाम “वितरण खिलाड़ियों” के साथ साझेदारी करने की योजना बनाई है।

इलेवनलैब्स

इलेवनलैब्स अलग-अलग आवाजों की एक श्रृंखला पेश करता है, कुछ सिंथेटिक, कुछ आवाज अभिनेताओं से क्लोन की गई।

इलेवनलैब्स को आवाज अभिनेताओं की आलोचना का भी सामना करना पड़ा है, जो दावा करते हैं कि कंपनी उनकी सहमति के बिना उनकी आवाज के नमूनों का उपयोग करती है – ऐसे नमूने जिनका उपयोग उस सामग्री को बढ़ावा देने के लिए किया जा सकता है जिसका वे समर्थन नहीं करते हैं या गलत और गलत जानकारी फैलाते हैं। में एक हाल ही का वाइस आर्टिकल में, पीड़ितों ने बताया कि कैसे इलेवनलैब्स का इस्तेमाल उनके खिलाफ उत्पीड़न अभियानों में किया गया था, एक उदाहरण में एक क्लोन आवाज का उपयोग करके एक अभिनेता की निजी जानकारी – उनके घर का पता – साझा करने के लिए।

फिर कमरे में एक हाथी है: इलेवनलैब्स जैसे अस्तित्वगत ख़तरे वाले प्लेटफ़ॉर्म ध्वनि अभिनय उद्योग के लिए खतरा पैदा करते हैं।

मदरबोर्ड लिखते हैं इस बारे में कि कैसे वॉयस एक्टर्स को अपनी आवाज के अधिकारों पर हस्ताक्षर करने के लिए कहा जा रहा है ताकि ग्राहक सिंथेटिक संस्करण तैयार करने के लिए एआई का उपयोग कर सकें जो अंततः उन्हें प्रतिस्थापित कर सकें – कभी-कभी बिना किसी मुआवजे के। डर यह है कि आवाज का काम – विशेष रूप से सस्ता, प्रवेश स्तर का काम – अंततः एआई-जनरेटेड वोकल्स द्वारा प्रतिस्थापित किया जाएगा, और अभिनेताओं के पास कोई सहारा नहीं होगा।

कुछ प्लेटफ़ॉर्म संतुलन बनाने की कोशिश कर रहे हैं। इस महीने की शुरुआत में, इलेवनलैब्स के प्रतिस्पर्धी रेप्लिका स्टूडियोज ने मीडिया कलाकार संघ के सदस्यों की आवाज़ की डिजिटल प्रतिकृतियां बनाने और लाइसेंस देने के लिए एसएजी-एएफटीआरए के साथ एक समझौते पर हस्ताक्षर किए। एक प्रेस विज्ञप्ति में, संगठनों ने कहा कि व्यवस्था ने कलाकार की सहमति सुनिश्चित करने के लिए “निष्पक्ष” और “नैतिक” नियम और शर्तें स्थापित कीं – और नए कार्यों में डिजिटल वॉयस डबल्स के उपयोग के लिए शर्तों पर बातचीत की।

हालाँकि, इससे भी कुछ वॉयस एक्टर्स खुश नहीं हुए – जिनमें SAG-AFTRA भी शामिल है अपने सदस्य.

इलेवनलैब्स का समाधान आवाजों के लिए एक बाज़ार है। वर्तमान में अल्फा में और अगले कई हफ्तों में अधिक व्यापक रूप से उपलब्ध होने के लिए तैयार, बाज़ार उपयोगकर्ताओं को एक आवाज बनाने, सत्यापित करने और इसे साझा करने की अनुमति देता है। स्टैनिसजेव्स्की का कहना है कि जब अन्य लोग आवाज का उपयोग करते हैं, तो मूल रचनाकारों को मुआवजा मिलता है।

उन्होंने कहा, “उपयोगकर्ता हमेशा अपनी आवाज की उपलब्धता और मुआवजे की शर्तों पर नियंत्रण बनाए रखते हैं।” “बाज़ार को स्थापित उद्योग प्रथाओं के साथ एआई प्रगति को सुसंगत बनाने की दिशा में एक कदम के रूप में डिज़ाइन किया गया है, साथ ही इलेवनलैब्स के प्लेटफ़ॉर्म पर विविध प्रकार की आवाज़ें भी लायी जा रही हैं।”

वॉइस एक्टर्स इस तथ्य पर आपत्ति जता सकते हैं कि इलेवनलैब्स नकद में भुगतान नहीं कर रहा है, हालांकि – कम से कम वर्तमान में नहीं। मौजूदा सेटअप में क्रिएटर्स को इलेवनलैब्स की प्रीमियम सेवाओं का श्रेय मिल रहा है (जो कुछ लोगों को विडंबनापूर्ण लगता है, मैं शर्त लगाता हूं)।

शायद यह भविष्य में बदल जाएगा क्योंकि इलेवनलैब्स – जो अब सबसे अच्छी तरह से वित्त पोषित सिंथेटिक वॉयस स्टार्टअप में से एक है – पेपरकप, डीपडब, इलेवनलैब्स, अकापेला, रेस्पीचर और वॉयस.एआई जैसी बैक अपस्टार्ट प्रतिस्पर्धा के साथ-साथ बिग टेक पदधारियों को हराने का प्रयास करता है। Amazon, Microsoft और Google के रूप में। किसी भी स्थिति में, इलेवनलैब्स, जो वर्ष के अंत तक अपने कर्मचारियों की संख्या 40 लोगों से बढ़ाकर 100 करने की योजना बना रही है, तेजी से बढ़ते सिंथेटिक आवाज बाजार में बने रहने और लहरें बनाने का इरादा रखती है।


CLICK ON IMAGE TO BUY

Leave a Reply

Your email address will not be published. Required fields are marked *

%d