பொருளடக்கம்:
- என்.எல்.பியில் பெரிய மாற்றங்கள்
- விவோடெக்ஸ்டில் அற்புதமான "உரைக்கு குரல்" படைப்புகள்
- சந்தைப்படுத்தல் செயற்கை குரல்
- உங்கள் குரல் வாழ்கிறது
- 2525 ஆம் ஆண்டில்
இந்த நாட்களில், பெரும்பாலான கணினி குரல்கள் கடந்து செல்கின்றன. உங்கள் தொலைபேசியில் "டிரயோடு" பில் செலுத்துதலுடன் உங்களுக்கு உதவும்போது அல்லது உங்களுக்கு என்ன துறை வேண்டும் என்று கேட்கும்போது சைபோர்க்ஸ் மற்றும் ரோபோக்களைப் பற்றி நீங்கள் அதிகம் கவலைப்பட மாட்டீர்கள். அட்டை தகவலுக்காக கர்ட் கோபேன் உங்களைத் தூண்டுவதை நீங்கள் திடீரென்று கேட்டால் என்ன செய்வது? அல்லது ஆரம்பகால வாக்களிப்பின் அதிசயங்களைப் பற்றி ஜான் எஃப் கென்னடி உங்களுக்குச் சொல்கிறாரா? அல்லது எல்விஸ் உங்கள் பெயரையும் முகவரியையும் "ஒரு ஹங்க், எரியும் அன்பின் ஹங்க்" என்று உடைப்பதற்கு முன் பெறுகிறாரா?
இவை அனைத்தும் இருக்கும் … கொஞ்சம் வித்தியாசமானது, ஆனால் இன்னும் கவர்ச்சிகரமான விஷயம் என்னவென்றால், தொழில்நுட்பம் அடிப்படையில் ஏற்கனவே இங்கே உள்ளது. ஒரு தசாப்தத்திற்கு அல்லது அதற்கு முன்பு, ஒரு கணினியின் திறனைக் கண்டு நாங்கள் ஆச்சரியப்பட்டோம். இப்போது, இலவச வரம்பில், கணினி உருவாக்கிய குரல்களால் நாங்கள் அறிந்திருக்கிறோம்.
என்.எல்.பியில் பெரிய மாற்றங்கள்
இயற்கையான மொழி செயலாக்கத் துறையில் (என்.எல்.பி) நீங்கள் கவனம் செலுத்துகிறீர்கள் என்றால், எங்கள் உலகளாவிய பொருத்துதல் அமைப்புகள் (ஜி.பி.எஸ்) மற்றும் தானியங்கு வணிகத்தில் இப்போது நாம் கேட்கும் பல வகையான பதிவு செய்யப்பட்ட மெய்நிகர் உதவியாளர் குரல்களுக்கு அப்பாற்பட்ட சில சமீபத்திய முன்னேற்றங்களைப் பற்றி நீங்கள் கேள்விப்பட்டிருக்கலாம். தொலைபேசி இணைப்புகள்.
என்.எல்.பியின் தொடக்கத்திற்கு மனித பேச்சின் பொது இயக்கவியல் குறித்து நிறைய ஆராய்ச்சி தேவைப்பட்டது. ஆராய்ச்சியாளர்கள் மற்றும் பொறியியலாளர்கள் தனித்தனி ஒலிப்பியல் அடையாளம் காண வேண்டும், அவற்றை சொற்றொடர்களையும் வாக்கியங்களையும் உருவாக்குவதற்கான அதிக வழிமுறைகளாக மடித்து, பின்னர் அனைத்தையும் மெட்டா மட்டத்தில் நிர்வகிக்க முயற்சிக்க வேண்டும். காலப்போக்கில், என்.எல்.பி தலைவர்கள் இதை மாஸ்டர் செய்து மனிதர்கள் சொல்வதைப் புரிந்துகொள்ள மேம்பட்ட வழிமுறைகளை உருவாக்கத் தொடங்கினர். இந்த இரண்டையும் ஒன்றாக இணைத்து, நிறுவனங்கள் இன்றைய மெய்நிகர் உதவியாளர்கள் மற்றும் முழு டிஜிட்டல் பில்-கட்டண எழுத்தர்களுக்கான இயக்கிகளைக் கொண்டு வந்தன, அவற்றின் நடத்தைகள் - எரிச்சலூட்டும் போது - அவற்றில் சென்ற வேலையைப் பற்றி நீங்கள் சிந்திப்பதை நிறுத்தும்போது இன்னும் ஆச்சரியமாக இருக்கிறது.
இப்போது, சில நிறுவனங்கள் பொதுவான மெய்நிகர் குரலுக்கு அப்பால் ஒரு குறிப்பிட்ட தனிப்பயனாக்கப்பட்ட முடிவை ஒன்றிணைக்கின்றன. இதற்கு ஒரு குறிப்பிட்ட நபரின் அகராதி வழியாகச் சென்று பெரிய அளவிலான தனித்துவமான குரல் வீடியோவைச் சேகரித்தல் தேவைப்படுகிறது, பின்னர் இந்த காப்பகத்தை ஒலிப்பியல், முக்கியத்துவம், கேடென்ஸ் மற்றும் மொழியியலாளர்கள் பெரும்பாலும் "புரோசோடி" என்ற பரந்த பதாகையின் கீழ் குழுவாகக் கொண்டிருக்கும் மற்ற அனைத்து சிறிய குறிப்புகளுக்கும் சிக்கலான தாளங்களுக்குப் பயன்படுத்த வேண்டும்.
வெளிவருவது ஒரு குறிப்பிட்ட நபரின் "சொந்தமானது" என்று கேட்போர் நினைக்கும் ஒரு குரல் - அவர்கள் அறிந்த மற்றும் பேசிய ஒருவர் அல்லது நபரின் புகழின் விளைவாக அவர்கள் அடையாளம் காணும் ஒருவர்.
எல்விஸ் முதல் மார்ட்டின் லூதர் கிங் வரை, யாருடைய குரலையும் இப்போது இந்த வழியில் "குளோன்" செய்யலாம் - அவர்களின் பேச்சின் கணிசமான பதிவு செய்யப்பட்ட பதிவு இருந்தால். தனிப்பட்ட சிறிய ஒலிகளுக்கு இன்னும் விரிவான பகுப்பாய்வு மற்றும் கையாளுதல்களைப் பயன்படுத்துவதன் மூலம், நிறுவனங்கள் ஒருவரின் குரலின் மெய்நிகர் கார்பன் நகலை உருவாக்க முடியும், அது உண்மையான விஷயத்தைப் போலவே ஒலிக்கிறது.
விவோடெக்ஸ்டில் அற்புதமான "உரைக்கு குரல்" படைப்புகள்
விவோடெக்ஸ்ட், எடுத்துக்காட்டாக, ஆடியோபுக்குகள் முதல் ஊடாடும் குரல் மறுமொழி (ஐவிஆர்) வரை அனைத்து வகையான பிரச்சாரங்களுக்கும் செயற்கை மனித குரல்களைப் பயன்படுத்துவதில் புரட்சியை ஏற்படுத்தும் ஒரு நிறுவனம். விவோடெக்ஸ்டில், ஆராய்ச்சி மற்றும் தயாரிப்பு குழுக்கள் கோட்பாட்டளவில், ஓல் ப்ளூ ஐஸ் போன்ற இறந்த பிரபலங்களின் குரல்களை குறிப்பாக பிரதிபலிக்கக்கூடிய செயல்முறைகளில் செயல்படுகின்றன.
"ஃபிராங்க் சினாட்ராவின் குரலை குளோன் செய்ய, நாங்கள் உண்மையில் அவரது பதிவு செய்யப்பட்ட மரபுக்குச் செல்வோம்" என்று விவோடெக்ஸ்ட் தலைமை நிர்வாக அதிகாரி கெர்ஷோன் சில்பர்ட் கூறுகிறார், இந்த வகையான தொழில்நுட்பம் எவ்வாறு செயல்பட முடியும் என்பதைப் பற்றி பேசுகிறது.
இப்போதே, விவோடெக்ஸ்ட் இந்த வகையான ஐடி முன்னோடி திட்டத்திற்கு ஒரு மாதிரியாக கையெழுத்திட்ட என்.பி.ஆர் நிருபர் நீல் கோனன் போன்ற எங்களுடன் இன்னும் இருப்பவர்களின் குரல்களை காப்பகப்படுத்துவதில் பணியாற்றி வருகிறது. ஒரு விளம்பர வீடியோ, விவோடெக்ஸ்ட் தொழிலாளர்கள் கோனனிலிருந்து வழங்கப்பட்ட குரல் உள்ளீட்டைப் பயன்படுத்தி ஒலிப்பு குறியீடு தொகுதிகளை சிரமமின்றி உருவாக்குவதைக் காட்டுகிறது. பின்னர் அவை உரை முதல் பேச்சு (டி.டி.எஸ்) கருவிகளுக்கான மாதிரிகளை உருவாக்குகின்றன, அவை வியத்தகு முறையில் மனித மற்றும் ஆளுமைமிக்க முடிவைத் தூண்டுகின்றன.
விவோடெக்ஸ்டில் மூலோபாயம் மற்றும் வணிக மேம்பாட்டின் துணைத் தலைவர் பென் ஃபைபல்மேன் கருத்துப்படி, கணினி ஒரு தனிப்பட்ட மனித குரலுக்கான புரோசோடிக் மாதிரியுடன் ஒத்துப்போக ஒரு ஃபோன் மட்டத்தில் (பேச்சின் மிகச்சிறிய தனித்துவமான பகுதிகளைப் பயன்படுத்தி) செயல்படுகிறது.
"குரல் எவ்வாறு பேசுகிறது என்பது இது அறிந்திருக்கிறது, " "யூனிட் தேர்வைப்" பயன்படுத்துவதன் மூலம், கணினி ஒரு குறுகிய வார்த்தையை ஒன்றிணைக்க பல துண்டுகளைத் தேர்வுசெய்கிறது, "வெள்ளிக்கிழமை" என்ற வார்த்தையை உருவாக்க உதவும் ஐந்து கூறுகள் எங்கே கொடுக்கப்படுகின்றன ஒரு குறிப்பிட்ட முக்கியத்துவம் மற்றும் டோனல் முடிவு.
சந்தைப்படுத்தல் செயற்கை குரல்
எனவே, சந்தைப்படுத்தல் துறையில் இது எவ்வாறு செயல்படுகிறது? விவோடெக்ஸ்டின் தயாரிப்புகள் ஆடியோ புத்தகங்கள் போன்ற தயாரிப்புகளை உருவாக்குவதில் மிகவும் பயனுள்ளதாக இருக்கும், அவை இலக்கு பார்வையாளர்களை அடையக்கூடும். எடுத்துக்காட்டாக, பொழுதுபோக்கு தொடர்பான தயாரிப்புகளை விற்க பயன்படுத்தினால், எல்விஸ் குரல் இன்றைய பொதுவான, டெட்பான், தானியங்கி குரல்களில் ஒன்றோடு ஒப்பிடப்படுவது எவ்வளவு பயனுள்ளதாக இருக்கும்?
அல்லது, அரசியலில் எப்படி? மிகவும் பயனுள்ள செய்தியிடல் தேவைப்படும் நிறுவனங்கள் அல்லது பிற தரப்பினருக்கான சந்தைப்படுத்தலை மேம்படுத்த இது போன்ற திட்டங்களைப் பயன்படுத்துவதற்கான பல்வேறு யோசனைகளில் ஃபைபிள்மேன் பணியாற்றி வருகிறார்.
"எந்தவொரு அரசியல்வாதியும் ஜனாதிபதியாக போட்டியிடுவது உங்களுக்குத் தெரிந்தால், இது 10 மில்லியன் ஸ்விங்-ஸ்டேட் வாக்காளர்களுக்கு ஒரு வேட்பாளரிடமிருந்து தனிப்பட்ட அழைப்பைப் பெறக்கூடும், அவர்களுக்கு அளித்த ஆதரவுக்கு நன்றி, அவர்கள் வாக்களிக்க எங்கு செல்ல வேண்டும், வானிலை மற்றும் அனைத்து வெட்டல்களையும் சொல்லலாம் தேர்தலுக்கு முந்தைய இரவு, "ஃபீபிள்மேன் கூறினார்.
உங்கள் குரல் வாழ்கிறது
இந்த தொழில்நுட்பம் அனைத்திற்கும் மற்றொரு தெளிவான பயன்பாடு உள்ளது. விவோடெக்ஸ்ட் போன்ற இயற்கை மொழி நிறுவனங்கள் ஒரு தனிப்பட்ட சேவையை உருவாக்க முடியும், அது வாடிக்கையாளரின் அனைத்து குரல் தரவையும் ஒரு தயாரிப்பில் பதிவேற்றும், அது அந்த நபரை "என்றென்றும் பேச" அனுமதிக்கும்.
நடைமுறைச் செயலாக்கம், பேசும் குரல்களை நாம் எவ்வாறு கேட்பது மற்றும் உள்வாங்குவது என்பது பற்றி பல கேள்விகளை எழுப்பக்கூடும். எடுத்துக்காட்டாக, ஒரு ஒலி ஸ்ட்ரீமை யாரோ போல சரியாக ஒலிக்க என்ன ஆகும்? ஒரு குறிப்பிட்ட குரலை அங்கீகரிக்க ஒரு நபரை நாம் எவ்வளவு நன்றாக அறிந்து கொள்ள வேண்டும்? மேலும், சுவாரஸ்யமாக, ஒரு இயல்பான மொழி சேவை கட்டாய மிமிக்ரிக்கு பதிலாக ஒரு கச்சா கேலிச்சித்திரத்தை உருவாக்கினால் என்ன ஆகும்?
முடிவுகளை மதிப்பீடு செய்வது, பெரும்பாலும் சூழலைக் கருத்தில் கொள்வதைப் பொறுத்தது. உதாரணமாக, குழந்தைகள் ஒரு கதையைக் கேட்கும்போது யார் பேசுகிறார்கள் என்பது குறித்து பொதுவாக கேள்விகளைக் கேட்க மாட்டார்கள் என்று அவர் கூறுகிறார். அவர்கள் இன்னும் விரும்புகிறார்கள். ஆனால், பல பெரியவர்கள் ஒரு செயலற்ற ஒளிபரப்பு அல்லது தொலைபேசி செய்தி போன்ற ஒரு குறிப்பிட்ட சூழ்நிலையில், அவர்களுடன் யார் பேசுகிறார்கள் என்பதைப் பற்றி யோசிக்கக்கூடாது. மேலும், தொலைபேசியில் ஒரு கணினியால் முட்டாளாக்கப்படுவது எளிதானது, ஏனென்றால் குழப்பமான ஒலி கணினி முடிவுகளுக்கும் மனித குரலுக்கும் இடையிலான குறைபாடுகள் அல்லது பிற முரண்பாடுகளை மறைக்கக்கூடும்.
"குரலின் நம்பகத்தன்மையை சவால் செய்வது உங்களுக்கு ஏற்படாது" என்று ஃபீபிள்மேன் கூறுகிறார்.
2525 ஆம் ஆண்டில்
தயாரிப்புகள் மற்றும் சேவைகளை வளர்ப்பதிலும், இந்த கேள்விகளுக்கு பதிலளிப்பதிலும் நிறுவனங்கள் முன்னேறும்போது, "வாழ்க்கை பேச்சு" தொழில்நுட்பங்கள் அந்த தொழில்நுட்பத்தின் ஒருங்கிணைப்பு மற்றும் மனித மனதை நோக்கி முன்னேறக்கூடும், இது பாரம்பரியமாக செயற்கை நுண்ணறிவு (AI) என்று அழைக்கப்படுகிறது.
கணினிகள் எங்களைப் போலவே பேச முடியுமானால், அவர்கள் மற்ற பயனர்களை அவர்கள் நம்மைப் போலவே நினைக்கிறார்கள் என்று நினைத்து ஏமாற்ற முடியும், இது ஒருமைப்பாட்டின் பெரிய கொள்கைக்கு ஊட்டமளிக்கிறது, 1950 களில் தொழில்நுட்ப முன்னோடியாக இருந்த ஜான் வான் நியூமன், எழுத்தாளர்களால் சுவிசேஷம் செய்யப்பட்டார். மற்றும் ரே குர்ஸ்வீல் போன்ற சிந்தனையாளர்கள். குர்ஸ்வீலின் 2005 ஆம் ஆண்டு எழுதிய "தி சிங்குலரிட்டி இஸ் நியர்" புத்தகம் சிலரை உற்சாகப்படுத்துகிறது, மற்றவர்களை பயமுறுத்துகிறது. 2045 ஆம் ஆண்டளவில், "நுண்ணறிவு" என்பது ஒரு நிகழ்வாக மனித மூளையில் இருந்து பெரிதும் அவிழ்க்கப்பட்டு தொழில்நுட்பத்திற்கு இடம்பெயர்ந்து, இயந்திரங்களுக்கும் அவற்றின் மனித எஜமானர்களுக்கும் இடையிலான கோடுகளை மழுங்கடிக்கும் என்று குர்ஸ்வீலின் கணிப்பு.
ஜாகர் & எவன்ஸின் "2525 ஆம் ஆண்டில்" (யாரும் இவர்களைப் போன்ற தவழும் அறிவியல் புனைகதைகளைச் செய்ய மாட்டார்கள்) பாடல்களில் அழியாதவர்கள்…
4545 ஆம் ஆண்டில்
உங்களுக்கு உங்கள் பற்கள் தேவையில்லை, தேவையில்லை
உங்களுடைய கண்கள்
நீங்கள் மெல்ல ஒரு விஷயத்தைக் கண்டுபிடிக்க முடியாது
யாரும் உங்களைப் பார்க்கப் போவதில்லை
5555 ஆம் ஆண்டில்
உங்கள் கைகள் உங்கள் பக்கங்களில் தொங்குகின்றன
உங்கள் கால்கள் செய்ய வேண்டியதில்லை
சில இயந்திரங்கள் உங்களுக்காக
கணினி குரல்கள் இந்த திசையில் ஒரு படி? மனித உடலின் சில செயல்பாடுகளை அவுட்சோர்ஸ் செய்வதற்கான ஒரு புதிய வழியாக (அல்லது பொதுவாக, அவற்றை உருவகப்படுத்துவதற்கு), இந்த வகையான தொழில்நுட்ப முன்னேற்றம் மிகப்பெரிய - மற்றும் அநேகமாக மதிப்பிடப்படாத - அடிவானத்தில் முன்னேறும் ஒரு ஒற்றை எதிர்காலத்தைப் பார்க்கும்போது . (வில் கம்ப்யூட்டர்ஸ் மனித மனதைப் பின்பற்ற முடியுமா? இல் உள்ள "ஒருமைப்பாடு" பற்றி?)
