K- అంటే క్లస్టరింగ్ అంటే ఏమిటి?

K- అంటే అల్గోరిథంతో డేటా మైనింగ్

K- అంటే క్లస్టరింగ్ పరిశీలనలకు ఉపయోగించే డేటా మైనింగ్ మరియు యంత్ర అభ్యాస సాధనం, ఆ సంబంధాల యొక్క పూర్వ పరిజ్ఞానం లేకుండా సంబంధిత పరిశీలనల సమూహంగా ఉపయోగించబడుతుంది. మాదిరి ద్వారా, ఆల్గోరిథం ఏ వర్గం, లేదా క్లస్టర్, డేటా కు చెందినదిగా చూపించడానికి ప్రయత్నిస్తుంది, విలువ k ద్వారా నిర్వచించబడిన సమూహాల సంఖ్యతో .

K- అంటే అల్గోరిథం అనేది సరళమైన క్లస్టరింగ్ టెక్నిక్లలో ఒకటి మరియు ఇది సాధారణంగా వైద్య ఇమేజింగ్, బయోమెట్రిక్స్ మరియు సంబంధిత క్షేత్రాలలో ఉపయోగించబడుతుంది. K యొక్క ప్రయోజనం - క్లస్టరింగ్ అంటే ప్రారంభంలో డేటా (అల్గోరిథం యొక్క పర్యవేక్షణ రూపం ఉపయోగించి) గురించి అల్గోరిథంకు ఆదేశించడం కంటే మీ డేటా గురించి (దాని పర్యవేక్షణా రహిత ఫారమ్ని ఉపయోగించి) గురించి చెబుతుంది.

ఇది కొన్నిసార్లు లాయిడ్స్ అల్గోరిథం అని పిలువబడుతుంది, ప్రత్యేకించి కంప్యూటర్ సైన్సు వర్గాలలో, ప్రామాణిక అల్గోరిథం మొదటి స్టువర్ట్ లాయిడ్ 1957 లో ప్రతిపాదించబడింది. "K-means" అనే పదాన్ని జేమ్స్ మక్ క్యుయిన్ 1967 లో ఉపయోగించారు.

ఎలా k- అంటే అల్గోరిథం విధులు

K- అంటే అల్గోరిథం ఒక పరిణామాత్మక అల్గోరిథం, దాని యొక్క ఆపరేషన్ పద్ధతి నుండి దాని పేరును పొందడం. K సమూహాలలో అల్గోరిథం సమూహ పరిశీలనలు, ఇక్కడ ఇన్పుట్ పరామితిగా k అందించబడుతుంది. అప్పుడు ప్రతి పరిశీలన సమూహం యొక్క పరిశీలన యొక్క సామీప్యత ఆధారంగా సమూహాలకు కేటాయించబడుతుంది. క్లస్టర్ యొక్క అర్ధము అప్పుడు పునఃప్రారంభం అవుతుంది మరియు ఆ ప్రక్రియ మళ్ళీ ప్రారంభమవుతుంది. అల్గోరిథం ఎలా పనిచేస్తుందో ఇక్కడ ఉంది:

  1. అల్గోరిథం ప్రారంభ క్లస్టర్ కేంద్రాలు (అంటే) గా k పాయింట్లు ఎంపిక చేసుకుంటుంది.
  2. డేటాసెట్లోని ప్రతి పాయింట్ క్లోస్టర్ క్లస్టర్కు కేటాయించబడుతుంది, ప్రతి పాయింట్ మరియు ప్రతి క్లస్టర్ సెంటర్ మధ్య యూక్లిడియన్ దూరం ఆధారంగా.
  3. ప్రతి క్లస్టర్ సెంటర్ ఆ క్లస్టర్లో పాయింట్లు సగటున పునఃప్రారంభించబడుతుంది.
  4. సమూహాలు కలుస్తాయి వరకు దశ 2 మరియు 3 పునరావృతం. కన్వర్జెన్స్ అనేది అమలును బట్టి విభిన్నంగా నిర్వచించబడవచ్చు, కాని ఇది సాధారణంగా 2 మరియు 3 దశలను పునరావృతం చేయబడినప్పుడు లేదా క్లస్టర్ల యొక్క నిర్వచనంలో మార్పులను భౌతిక వ్యత్యాసం చేయలేనప్పుడు ఎటువంటి పరిశీలనలు క్లస్టర్లను మార్చవు.

క్లస్టర్ల సంఖ్యను ఎంచుకోవడం

K కు ప్రధాన నష్టాలు ఒకటి- క్లస్టరింగ్ సంఖ్య మీరు అల్గోరిథంకు ఇన్పుట్గా పేర్కొనాలి. రూపొందించినట్లుగా, క్రమసూత్ర పద్ధతి తగిన సంఖ్యలో సమూహాలను గుర్తించలేకపోతుంది మరియు వినియోగదారుని ముందుగానే గుర్తించడానికి ఇది ఆధారపడి ఉంటుంది.

ఉదాహరణకు, మీరు పురుష లేదా స్త్రీగా బైనరీ లింగ గుర్తింపు ఆధారంగా క్లస్టర్ అయిన వ్యక్తుల సమూహాన్ని కలిగి ఉంటే, ఇన్పుట్ k = 3 ను ఉపయోగించి k- అంటే అల్గోరిథం అని పిలుస్తారు, ప్రజలు కేవలం రెండు లేదా మూడు సార్లు k = 2 యొక్క ఇన్పుట్, మరింత సహజ అమరికను అందిస్తుంది.

అదేవిధంగా, వ్యక్తుల యొక్క ఒక సమూహం స్వదేశీ స్థితిపై సులభంగా క్లస్టర్ చేయబడితే మీరు k- అంటే ఇన్పుట్ k = 20 తో అల్గోరిథం అని పిలుస్తారు , ఫలితాలు సమర్థవంతంగా ఉండటానికి చాలా సాధారణం కావచ్చు.

ఈ కారణంగా, ఇది తరచుగా మీ డేటాకు ఉత్తమంగా సరిపోయే విలువను గుర్తించడానికి k యొక్క విభిన్న విలువలతో ప్రయోగించడానికి మంచి ఆలోచన. మీరు యంత్రం నేర్చుకున్న జ్ఞానం కోసం మీ అన్వేషణలో ఇతర డేటా మైనింగ్ అల్గోరిథంల వినియోగాన్ని అన్వేషించాలని అనుకోవచ్చు.