பொருளடக்கம்:
- வெவ்வேறு மூலங்களிலிருந்து தரவு இணைக்க மற்றும் வரைபடம் கடினம்
- தரவை ஒன்றிணைக்க ஹடூப் நிபுணர்கள் முயற்சி
பகுப்பாய்வு செயலாக்கத்திற்கான தரவை ஆஃப்லோட் செய்ய அல்லது ஏற்கனவே உள்ள கணினிகளுடன் சாத்தியமில்லாத ஒற்றை தரவு மூலத்தின் பெரிய தொகுதிகளை மாதிரியாக்குவதற்கு ஹடூப் ஒரு சிறந்த இடம். இருப்பினும், நிறுவனங்கள் பல மூலங்களிலிருந்து தரவை ஹடூப்பில் கொண்டு வருவதால், வெவ்வேறு ஆதாரங்களில் தரவைப் பகுப்பாய்வு செய்வதற்கான தேவை அதிகரித்து வருகிறது, இது அடைய மிகவும் கடினமாக இருக்கும். ஹடூப்பிற்குள் வெவ்வேறு தரவு மூலங்களையும் வகைகளையும் பகுப்பாய்வு செய்ய முயற்சிக்கும்போது, நிறுவனங்கள் எதிர்கொள்ளும் பிரச்சினைகள் மற்றும் இந்த சவால்களை எவ்வாறு தீர்ப்பது என்பதை விளக்கும் மூன்று பகுதி தொடர்களில் இந்த இடுகை முதன்மையானது. இன்றைய இடுகை பல உள் மூலங்களை இணைக்கும்போது ஏற்படும் சிக்கல்களை மையமாகக் கொண்டுள்ளது. வெளிப்புற தரவு மூலங்கள் சேர்க்கப்படுவதால், இந்த சிக்கல்கள் ஏன் சிக்கலான தன்மையை அதிகரிக்கின்றன என்பதையும், அவற்றை தீர்க்க புதிய அணுகுமுறைகள் எவ்வாறு உதவுகின்றன என்பதையும் அடுத்த இரண்டு பதிவுகள் விளக்குகின்றன.
வெவ்வேறு மூலங்களிலிருந்து தரவு இணைக்க மற்றும் வரைபடம் கடினம்
மாறுபட்ட மூலங்களிலிருந்து தரவுகள் வெவ்வேறு கட்டமைப்புகளைக் கொண்டுள்ளன, அவை தரவு வகைகளை ஒன்றாக இணைப்பது மற்றும் வரைபடமாக்குவது கடினம், உள் மூலங்களிலிருந்து தரவுகள் கூட. வாடிக்கையாளர்களுக்கு பல கணக்கு எண்கள் இருந்தால் அல்லது ஒரு நிறுவனம் மற்ற நிறுவனங்களுடன் கையகப்படுத்தியிருந்தால் அல்லது ஒன்றிணைந்திருந்தால் தரவை இணைப்பது மிகவும் கடினம். கடந்த சில ஆண்டுகளில், சில நிறுவனங்கள் தரவு கண்டுபிடிப்பு அல்லது தரவு அறிவியல் பயன்பாடுகளைப் பயன்படுத்தி ஹடூப்பில் சேமிக்கப்பட்ட பல மூலங்களிலிருந்து தரவை பகுப்பாய்வு செய்ய முயற்சித்தன. இந்த அணுகுமுறை சிக்கலானது, ஏனெனில் இது நிறைய யூகங்களை உள்ளடக்கியது: பயனர்கள் பல்வேறு தரவு மூலங்களை இணைக்க எந்த வெளிநாட்டு விசைகள் பயன்படுத்த வேண்டும் என்பதை தீர்மானிக்க வேண்டும் மற்றும் தரவு மாதிரி மேலடுக்குகளை உருவாக்கும்போது அனுமானங்களை செய்ய வேண்டும். இந்த யூகங்களை சோதிப்பது கடினம் மற்றும் அளவில் பயன்படுத்தும்போது பெரும்பாலும் தவறானது, இது தவறான தரவு பகுப்பாய்வு மற்றும் ஆதாரங்களின் அவநம்பிக்கைக்கு வழிவகுக்கிறது.
தரவை ஒன்றிணைக்க ஹடூப் நிபுணர்கள் முயற்சி
எனவே, தரவு மூலங்களில் தரவை பகுப்பாய்வு செய்ய விரும்பும் நிறுவனங்கள், தரவு தொகுப்புகளை ஒன்றிணைக்க தனிப்பயன், மூல-குறிப்பிட்ட ஸ்கிரிப்ட்களை உருவாக்க ஹடூப் நிபுணர்களை நியமிக்க முயன்றன. இந்த ஹடூப் வல்லுநர்கள் பொதுவாக தரவு ஒருங்கிணைப்பு அல்லது நிறுவனத் தீர்மான வல்லுநர்கள் அல்ல, ஆனால் அவர்கள் நிறுவனத்தின் உடனடித் தேவைகளை நிவர்த்தி செய்ய தங்களால் முடிந்ததைச் செய்கிறார்கள். இந்த வல்லுநர்கள் குறிப்பிட்ட மூலங்களிலிருந்து கட்டமைக்கப்பட்ட தரவை எவ்வாறு இணைப்பது என்பதைத் தீர்மானிக்கும் கடினமான மற்றும் வேகமான விதிகளை எழுத பிக் அல்லது ஜாவாவைப் பயன்படுத்துகிறார்கள், எ.கா. கணக்கு எண்ணின் அடிப்படையில் பொருந்தக்கூடிய பதிவுகள். இரண்டு ஆதாரங்களுக்கான ஸ்கிரிப்ட் எழுதப்பட்டதும், மூன்றாவது மூலத்தைச் சேர்க்க வேண்டியிருந்தால், முதல் ஸ்கிரிப்டைத் தூக்கி எறிந்துவிட்டு, மூன்று குறிப்பிட்ட மூலங்களை இணைக்க புதிய ஸ்கிரிப்ட் வடிவமைக்கப்பட்டுள்ளது. மற்றொரு மூலத்தைச் சேர்த்தால், அதேபோல் நடக்கும். இந்த அணுகுமுறை திறமையற்றது மட்டுமல்லாமல், அளவிலும் பயன்படுத்தப்படும்போது தோல்வியடைகிறது, விளிம்பில் உள்ள வழக்குகளை மோசமாகக் கையாளுகிறது, அதிக எண்ணிக்கையிலான நகல் பதிவுகளை ஏற்படுத்தக்கூடும், மேலும் பல பதிவுகளை ஒன்றிணைக்கக் கூடாது.
