Adatbányászat

Mi az adatbányászat:

Az adatbányászat egy olyan angol nyelvű kifejezés, amely számítógépes tudományhoz kapcsolódik, és amelynek fordítása az adatbányászat . Olyan funkcionalitásból áll, amely az adatokat összesíti és megszervezi, megtalálva a megfelelő mintákat, társulásokat, változásokat és anomáliákat .

Az adatbányászat fogalma 1990-ben jelent meg az adatbázis-közösségekben. Az adatbányászat a KDD néven ismert folyamatelemzési lépés ( Knowledge Discovery in Databases ), melynek szó szerinti fordítása "Knowledge Discovery in Databases".

Az adatbányászat néhány alapvető lépésre osztható: feltárás, modellépítés, mintázatmeghatározás, validálás és ellenőrzés.

Az adatgyűjtés viszonylag újabb gyakorlat a számítástechnika világában, és információ-visszakeresést, mesterséges intelligenciát, mintázatfelismerést és statisztikai technikákat használ a különböző adatok közötti korrelációk keresésére, amelyek lehetővé teszik, hogy egy vállalat vagy egyén számára hasznos tudást szerezzen. Egy vállalat esetében az adatbányászat fontos eszköz lehet az innováció és a jövedelmezőség növelésében.

Az adatbányászat használata meglehetősen gyakori a nagy adatbázisokban, és használatuk végeredménye szabályokon, hipotéziseken, döntési fákon, dendrogramokon stb.

A jól végrehajtott adatbányászatnak olyan feladatokat kell végrehajtania, mint: anomália észlelés, társulási szabálytanulás (függőségmodellezés), klaszterezés, osztályozás, regresszió és összefoglalás. Az adatbányászati folyamat jellemzően az adattárházban lévő adatok felhasználásával történik.

Számos olyan cég és szoftver található, amelyek az adatbányászatra irányulnak, mivel az adatbázisokban a minták azonosítása egyre fontosabb. A vonatkozó szabványok azonosítása azonban nem egyedülálló a számítógép világában. Az emberi agy hasonló eljárást alkalmaz a minták azonosítására és a tudás megszerzésére.

Az elmúlt években az adatbányászatot széles körben használták a tudomány és a technika területén, mint például a bioinformatika, a genetika, az orvostudomány, az oktatás és az elektrotechnika.

Az adatbányászat fogalma gyakran kapcsolódik az emberek viselkedéséről szóló információk kinyeréséhez. Emiatt bizonyos helyzetekben az adatbányászat jogi kérdéseket és a magánélethez és az etikához kapcsolódó kérdéseket vet fel. Ennek ellenére sokan azt állítják, hogy az adatbányászat etikai szempontból semleges, mivel nincs etikai következménye.

Valódi adatbányászati példák

Az adatok bányászatát gyakran a vállalatok és szervezetek használják fel a felhasználók / alkalmazottak / ügyfelek ismereteinek megszerzésére. Például a közszférában lehetőség van a munkavállaló családi állapotának és az általuk keresett fizetésnek a keresztellenőrzésére, hogy megtudja, hogy ez befolyásolja-e a házassági életét.

Az olyan cégek, mint a szupermarketláncok, használhatják ezt a keresztadatot az együtt vásárolt termékek meghatározására. Ha az X terméket vásárló vásárló Y terméket vásárol, jó ötlet lehet, ha a két terméket a közelben helyezzük el, hogy megkönnyítsük a vásárló számára.