Domeniul de studiu al studiului
Orice cercetare constă în observarea proprietăților obiectelor pentru a elucida și evalua relațiile semnificative și relațiile dintre indicatorii acestor proprietăți.
Domeniul de subiect include obiecte care diferă în funcție de proprietăți și sunt, în anumite privințe, interconectate. Decizia problemelor din domeniul programării începe cu studiul domeniului.
Domeniul subiect este o parte a lumii reale, care este infinită și conține atât date importante, cât și neesențiale. Cercetătorul trebuie să poată aloca o parte semnificativă a acestora. De exemplu, atunci când se decide asupra emiterii unui împrumut, toate datele despre viața privată a clientului (dacă activitatea soțului / soției, dacă clientul ridică copiii minori, educația clientului etc.) va fi considerată semnificativă. Și pentru a rezolva o altă sarcină legată de sectorul bancar, astfel de date vor fi complet irelevante. Semnificația datelor depinde de ceea ce alegem ca domeniu.
În procesul de cercetare este necesar să se creeze un model de domeniu. Cunoștințele din diferite surse ar trebui să fie formalizate. Domeniul este formalizat cu ajutorul unor persoane fonduri. fonduri pot fi foarte diferite. Aceasta poate fi o descriere textuală a domeniului sau o notație grafică specializată. Cu ajutorul modelului de domeniu, sunt descrise procesele care apar în el, iar datele acestui domeniu de studiu sunt studiate.
Formularea problemei constă, de asemenea, în descrierea comportamentului static și dinamic al obiectelor pe care le investigăm. Descrierea comportamentului static implică caracterizarea obiectelor și a proprietăților lor. Când se descrie comportamentul dinamic, se caracterizează motivele pentru comportamentul obiectelor.
Comportamentul dinamic al obiectelor este deseori descris împreună cu comportamentul static.
Uneori, analiza domeniului și afirmația problemei sunt combinate într-o etapă.
În etapa de definire și analiză a cerințelor de date, datele necesare pentru implementarea Data Mining sunt modelate. În acest scop, întrebările distribuției de utilizatori-analitice caracteristicile sistemului - întrebări privind accesul la datele necesare pentru analiză.
Domeniul subiect este analizat mai ușor și mai eficient atunci când are organizația depozit de date. Cu toate acestea, nu toate întreprinderile au astfel de stocuri de date. În acest caz, sursa datelor inițiale sunt bazele de date operaționale, materialele de referință și arhivă, adică date din sistemele informatice deja existente (sisteme informatice).
Informațiile din partea administratorilor IP, a surselor externe și interne, a diferitelor documente pe suporturi de hârtie, precum și a cunoștințelor specialiștilor și / sau a rezultatelor sondajului pot fi totuși necesare.
De asemenea, este necesar să se știe că, în timpul pregătirii datelor, dezvoltatorii de programe ar trebui să descrie cât mai mulți factori care pot afecta procesul. Unele date pot fi codate aici. De exemplu, una dintre caracteristicile unui client este nivelul venitului său, care poate fi definit ca fiind: foarte scăzut, scăzut, mediu, înalt, foarte ridicat. În acest caz, trebuie să stabiliți nivelul de absolvire a veniturilor.
La determinarea cantității corecte de date, trebuie să se țină cont de ordonarea datelor.
În cazul în care sunt comandate, este necesar să se știe dacă o componentă sezonieră / ciclică este inclusă într-un astfel de set de date. Când nu sunt comandate, adică setul de evenimente din baza de date nu are legătură cu cronologia, atunci în cursul colectării, trebuie respectate următoarele reguli:
1) un număr mic de înregistrări în baza de date poate fi motivul creării unui model inadecvat;
2) precizia modelului poate fi îmbunătățită odată cu creșterea numărului de date;
3) datele depășite sunt excluse din set;
4) Algoritmii folosiți pentru a crea un model folosind baze de date foarte mari ar trebui să fie scalabile.
- Pașaportul specialității 05: detalii și nuanțe
- Cercetarea empirică este o metodă de colectare a datelor despre un fenomen
- Cross-selling - un instrument eficient pentru realizarea unui profit
- Care sunt datele? Tipuri de date
- Analiza și sinteza în economie
- Scopul cercetării este ... Subiectul, obiectul, subiectul, obiectivele și scopul studiului
- Studiu longitudinal: definiția și caracteristicile conducerii
- "Sisteme intelectuale în sfera umanitară": conținutul disciplinei și domeniul aplicării…
- Observarea ca metodă de cercetare
- Metode de bază de colectare a informațiilor
- Clasificarea metodelor de cercetare psihologică în știința modernă
- Ce determină obiectul și subiectul cercetării
- Politica ca obiect de cercetare în stadiul actual al dezvoltării societății
- Pe scurt: sociologie și științe politice. Subiect, metode, funcții
- Cercetare empirică
- Metodologia și metodele de cercetare științifică
- Proprietățile de bază ale informațiilor
- Model de date relațional, baze de date, modele și scheme de proiectare
- Verificarea este procesul de verificare a unui produs software
- Metode de bază ale psihologiei ca instrument al cunoașterii umane
- Prelucrarea statistică a datelor și a caracteristicilor acestora