பொருளடக்கம்:
வரையறை - தரவு ரேங்கிங் என்றால் என்ன?
தரவு சச்சரவு என்பது ஒரு குறிப்பிட்ட வகை தரவு நிர்வாகமாகும், இது புதிய மென்பொருள் திறன்களிலிருந்து பெரிய, குழப்பமான மற்றும் மாறுபட்ட தரவுத் தொகுப்புகளை அறிமுகப்படுத்துகிறது, அவை பகுப்பாய்வு மற்றும் பயன்பாட்டின் நோக்கங்களுக்காக சேவை சார்ந்த கட்டமைப்பிற்கு (SOA) செல்ல வேண்டும். தரவு சச்சரவு பொதுவாக ஒழுங்கற்ற அல்லது மாறுபட்ட தரவைக் கையாள்வதற்கும் வணிக பயன்பாட்டு நிகழ்வுகளுக்கு கையாளுவதற்கும் பலவிதமான அதிநவீன நுட்பங்களை உள்ளடக்கியது.
டெக்கோபீடியா தரவு மோதலை விளக்குகிறது
இது ஒரு முறைசாரா சொல் போல் தோன்றலாம், ஆனால் தரவு சச்சரவு உண்மையில் தரவு நிர்வாகத்தில் ஒரு குறிப்பிட்ட இடத்தை ஆக்கிரமிக்கிறது. தரவு சண்டையைப் புரிந்துகொள்வதற்கான ஒரு பயனுள்ள வழி, அதை பெரும்பாலும் முறையான சாறு, உருமாற்றம் மற்றும் சுமை (ஈ.டி.எல்) முறையுடன் வேறுபடுத்துவதாகும். தரவு சண்டையில் ETL ஐ விட வெவ்வேறு அம்சங்கள் மற்றும் பயன்பாட்டு வழக்குகள் உள்ளன. இது பெரும்பாலும் திறமையான தரவு விஞ்ஞானிகள் அல்லது பைப்லைனுக்கு நெருக்கமான மற்றவர்களால் செய்யப்படுகிறது. சில வழிகளில், தரவு சண்டையை ஒரு வகை "ஓப்பன் சோர்ஸ்" ஈ.டி.எல் என்று அழைக்கலாம், அதில் தரவைக் கையாளும் பொறியியலாளர்கள் அதிக "கைகளில்" இருக்கலாம் அல்லது கூடுதல் கையேடு முறைகளைப் பயன்படுத்தலாம்.
சுத்திகரிக்கப்பட்ட செயல்முறைகளை உண்மையில் புரிந்துகொள்பவர்களுக்கு, பல்வேறு தரவுகள் சேகரிக்கப்பட்டு, வரிசைப்படுத்தப்பட்டு, நிறுவன கட்டமைப்பிற்குள் ஊட்டப்படுகின்றன, தரவு சண்டை என்பது உண்மையில் மிக முக்கியமான தலைப்பு. தகவல் தொழில்நுட்ப வல்லுநர்கள் குழப்பமான, மூல அல்லது கட்டமைக்கப்படாத தரவுகளிலிருந்து மதிப்பைக் கொண்டுவருவதற்கான கருவிகள், வளங்கள் மற்றும் நுட்பங்களின் பரந்த வரிசையைப் பார்க்கிறார்கள்.
