2007 m. spalio 30 d., antradienis

Kaip išvengti klaidų pasirenkant duomenų išgavimo sistemas (angl. Data Mining)

Terminas „duomenų išgavimo technologija“ (angl. Data mining) skamba paslaptingai. Be akivaizdžios diegimo rizikos gali gąsdinti ir pirmoji naudojimo patirtis. Atsižvelgiant į pakankamai sudėtingą „data mining“ technologijos prigimtį verslo naudotojai neturi aiškaus supratimo, kaip naudojant šią pažangią technologiją galima kelti veiklos efektyvumo rodiklius. Versle „data mining“ technologijos naudojamos klientų elgesio modelių sukūrimui, prognozuojant ir tikrinant kainodaros strategijų rezultatus ir kt., o sąvoka „Data mining“ daugeliui asocijuojasi su sąvokomis: neuroniniai tinklai, genetiniai algoritmai, evoliuciniai statistiniai skaičiavimai, žinių aptikimas (angl. Knowledge discovery), semantinių struktūrų aptikimas (angl. Pattern discovery) ir kt.
Duomenų išgavimo technologijų taikymai versle prasidėjo prieš porą dešimtmečių, ir nuo tų laikų ši technologija išsivystė, pasidarė labiau lanksti ir paprastesnė valdyme. Bet diegimo, rezultatų interpretavimo ir integravimo sunkumai paliko tikrai nelabai teigiamus prisiminimus ir stabdo tolimesnę šios technologijos plėtrą organizacijose.
Pradėsime nuo pirmų diegimo ir lanksčios infrastruktūros žingsnių.
Išsiaiškinsime, ką mes turime omenyje, kalbant apie duomenų išgavimo technologiją. Tai ne tik istorinių duomenų paieška duomenų saugyklose ir duomenų bazėse pasirenkant konkrečius parametrus, kas kitaip galėtų būti pavadinta operatyvine analizė (OLAP, angl. On-Line Analytical Processing).
Pateiksiu vieną paprastą OLAP ir duomenų išgavimo technologijos panaudojimo pavyzdį: surasti duomenų saugykloje visus vyriškos lyties asmenis, kurių amžius yra tarp 24 ir 45 metų, kurie gyvena Vilniuje, Kaune arba Klaipėdoje, turi didesnį atlyginimą negu statistinis šalies privataus sektoriaus atlyginimų vidurkis, kurie pastaruoju dvejų mėnesių laikotarpiu skrido į Kijevą, Taliną, Rygą arba Kišiniovą dažniau negu kartą. Šiame pavyzdyje suformuojama pakankamai konkreti užklausa duomenų saugyklos valdymo sistemai. Bet „Data mining“ technologija turi žymiai daugiau galimybių, negu sudėtingų užklausų į daugiamačius duomenų masyvus vykdymas...
Apžvelgsime tokią „Data mining“ galimybę kaip automatinės priemonės naujų, anksčiau nežinomų arba nenustatytų semantinių ryšių ir struktūrų nustatymas tarp akivaizdžiai nepriklausomų duomenų. Paprasčiau sakant, panaudoti semantinių ryšių paieškos rezultatus nuspėjant ir prognozuojant veiksmus, reikšmes ir charakteristikas pasinaudojant informacija, paslėpta didžiuliuose duomenų masyvuose.

Neteisingi būdai duomenų išgavimo sistemoms pirkti

Dažniausiai organizacijos pasirenka tam tikrą programinį produktą priklausomai nuo turimų žinių apie jame naudojamas technologijas ir standartinių produktų ir paslaugų vertinimo ir pasirinkimo metodų. Technologinių sprendimų pasirinkimas tokiais būdais – garantuotas kelias į pasirinkimo aklavietę:

  • Renkama reklaminė medžiaga ir dokumentacija apie skirtingų tiekėjų siūlomus produktus;
  • Kviečiamasi į susitikimus tų tiekėjų, kurių siūlomos kainos yra nustatyto biudžeto ribose;
  • Gauna daug nemokamos informacijos dalyvaujant pristatymuose;
  • Perka programinius produktus iš to tiekėjo, kas paskutinis darė pristatymą;
  • Iš pradžių bando patys išbandyti produktus savo IT skyriuose įvedant duomenis ir laukiant stebuklingų rezultatų...

Kartais, organizacijai nesėkmingai išbandžius „Data mining“, atsisakoma šios technologijos. Faktiška pirmosios nesėkmės kaina gali būti didžiulė, nes organizacija ne tik patyria nuostolius dėl neišnaudotų galimybių, bet pas konkurentus atsiranda daugiau galimybių išlošti pranašumų. Be to, kompanijoje po nesėkmės gali nukristi vidinė kolektyvo moralinė savijauta.
Galu gale, ateityje „Data mining“ technologijos bus naudojamos tame ar kitokiame pavidale visomis didelio ir vidutinio didžio organizacijose. Jeigu organizacijai pirmojo diegimo patirtis yra nesėkminga, ateityje jai teks pakartoti savo bandymus įdiegti šias technologijas, svarbiausiai, nepakartoti savo klaidų vėl.

Geresnis „Data mining“ technologijų diegimo būdas
Rekomenduojamas „Data mining“ diegimo būdas - realaus efektyvumo ir laukiamų rezultatų palyginimas.

Informacija ruošiama...

Komentarų nėra: