Məlumat Elmi və Böyük Məlumat Hadoop eynidir? Onların arasında fərq var və ya hər ikisi eyni şeyi nəzərdə tutur?


cavab 1:

Xeyr, qətiliklə deyil.

Bu problemi üç hissəyə ayıraq:

Məlumat Elmi, statistika, kombinatorika, riyaziyyat və informatika və s. Fərqli metodlarla müxtəlif problemlərin həlli üçün bir ixtisasdır.

Big Data: Geniş mənada geniş məlumatlar ənənəvi metodlardan kənarda böyük miqdarda məlumat ("nəhəng nisbidir") ilə əlaqəli bir anlayışdır.

Hadoop: Hadoop, çox sayda məlumatın müxtəlif vasitələrlə (PIG, HIVE, Scoop, Fume və s.) İdarə və təhlil edilə biləcəyi bir çərçivə və ya bir mühit.

İstinadlar:

Hadoop dərsi

Məlumat elmi

Böyük məlumatlar


cavab 2:

Güman edirəm ki, "Məlumat Elmi" və "Böyük Məlumat Hadoop" iki fərqli şeydir, amma üçü var. Məlumat elmi, böyük məlumatlar və Hadoopun fərqli mənaları var.

Deyək ki, siz 10-cu sinif şagirdisiniz. Hər bir fənn üzrə sinif yoldaşlarınızın qazandıqları qiymətlərin ortalama vəzifəsi verilmişdir. Sinifinizdə 50 tələbə var, hər biri 5 fəndən oxuyur. Orta tapmaq raket elmi deyil, hər şeyi bir Excel vərəqində edin. İndi müəlliminiz təxminən 150 tələbədən ibarət bütün A, B və C bölmələri üçün eyni hesablama aparmağı xahiş edəcək. Excel cədvəli yenə kifayətdir. İndi ölkə daxilində 10-cu sinif şagirdləri üçün orta elmi qiymətlərin nə olduğunu bilmək istəyirsiniz. Bu, 2016-cı ildə təxminən 14,31,861 tələbədir. Çox məlumatı bir Excel vərəqində saxlaya bilməməyiniz üçün MySQL və ya Oracle kimi bir verilənlər bazasında saxlaya bilərsiniz. Orta tapmaq üçün SQL sorğusunu işlədirsiniz. İndi 10-cu sinif üçün elmin orta hesabla 20 il ərzində necə hərəkət etdiyini, təxminən 3000000 qeydlərə uyğundur. Bütün elmlərin deyil, bütün 5 fənnin orta hesabını tapsaydın, 30.000.000 x 5 qeydləri emal edərdin. Məlumatlar indi böyükdür, bu da "böyük məlumatlar" kimi tanınır.

Big Data - xüsusən insanın davranışı və qarşılıqlı əlaqələri ilə əlaqədar nümunələri, meylləri və birləşmələri aşkar etmək üçün riyazi olaraq təhlil edilə bilən son dərəcə böyük məlumat. - Vikipediyadan

Yəqin ki, bu qədər məlumatı MySQL və ya Oracle-da saxlamamalı və SQL sorğunuzu milyonlarla qeydlərdə işlətməməlisiniz. Heç vaxt SQL verilənlər bazasında bu qədər məlumatı işləməmişəm, buna görə onun fəaliyyətini şərh etməyəcəyəm, amma Hadoop-dan bəhs etdiyimiz tələbə verilənlər bazasından çox böyük miqdarda qeydlərin işlənməsi üçün istifadə etdim. Hadoop, məlumatları bir neçə sistemə paylayan bir çərçivədir ki, bütün sistemlər paralel olaraq hesablaya bilər ki, bu da hesablanmanın ümumi sürətini artırır, bu da paylanmış hesablama adlanır. Hadoop-un böyük bir məlumat üçün məlumat saxlama sistemi olan öz fayl sistemi var.

Layman baxımından məlumat elmi, böyük və ya kiçik olaraq məlumatla nə edəcəyinizi dərk edən bir elmdir. İndiyə qədər yalnız balları orta hesablamağa çalışdıq, ancaq bir məlumat alimi də orta ilə nəyin əldə olunacağını tapmaq yollarına baxdı. Bir təşkilat üçün, onlara iş qərarları verməyə və menecerlərə daha yaxşı qərar verməyə və mənfəət artırmaq üçün qaynaqlar ayırmağa kömək edən nümunələri tapmağa kömək edir. Əksər məlumat alimləri böyük məlumatlarla maraqlanmasalar belə Hadoop-dan istifadə edə bilməzlər. Hesablamaları üçün ümumiyyətlə R lang və ya Python istifadə edirlər.

Böyük məlumatlar bir anlayışdır. Hadoop bir vasitədir. Məlumat elmi kompüter elminin bir sahəsidir.


cavab 3:

Güman edirəm ki, "Məlumat Elmi" və "Böyük Məlumat Hadoop" iki fərqli şeydir, amma üçü var. Məlumat elmi, böyük məlumatlar və Hadoopun fərqli mənaları var.

Deyək ki, siz 10-cu sinif şagirdisiniz. Hər bir fənn üzrə sinif yoldaşlarınızın qazandıqları qiymətlərin ortalama vəzifəsi verilmişdir. Sinifinizdə 50 tələbə var, hər biri 5 fəndən oxuyur. Orta tapmaq raket elmi deyil, hər şeyi bir Excel vərəqində edin. İndi müəlliminiz təxminən 150 tələbədən ibarət bütün A, B və C bölmələri üçün eyni hesablama aparmağı xahiş edəcək. Excel cədvəli yenə kifayətdir. İndi ölkə daxilində 10-cu sinif şagirdləri üçün orta elmi qiymətlərin nə olduğunu bilmək istəyirsiniz. Bu, 2016-cı ildə təxminən 14,31,861 tələbədir. Çox məlumatı bir Excel vərəqində saxlaya bilməməyiniz üçün MySQL və ya Oracle kimi bir verilənlər bazasında saxlaya bilərsiniz. Orta tapmaq üçün SQL sorğusunu işlədirsiniz. İndi 10-cu sinif üçün elmin orta hesabla 20 il ərzində necə hərəkət etdiyini, təxminən 3000000 qeydlərə uyğundur. Bütün elmlərin deyil, bütün 5 fənnin orta hesabını tapsaydın, 30.000.000 x 5 qeydləri emal edərdin. Məlumatlar indi böyükdür, bu da "böyük məlumatlar" kimi tanınır.

Big Data - xüsusən insanın davranışı və qarşılıqlı əlaqələri ilə əlaqədar nümunələri, meylləri və birləşmələri aşkar etmək üçün riyazi olaraq təhlil edilə bilən son dərəcə böyük məlumat. - Vikipediyadan

Yəqin ki, bu qədər məlumatı MySQL və ya Oracle-da saxlamamalı və SQL sorğunuzu milyonlarla qeydlərdə işlətməməlisiniz. Heç vaxt SQL verilənlər bazasında bu qədər məlumatı işləməmişəm, buna görə onun fəaliyyətini şərh etməyəcəyəm, amma Hadoop-dan bəhs etdiyimiz tələbə verilənlər bazasından çox böyük miqdarda qeydlərin işlənməsi üçün istifadə etdim. Hadoop, məlumatları bir neçə sistemə paylayan bir çərçivədir ki, bütün sistemlər paralel olaraq hesablaya bilər ki, bu da hesablanmanın ümumi sürətini artırır, bu da paylanmış hesablama adlanır. Hadoop-un böyük bir məlumat üçün məlumat saxlama sistemi olan öz fayl sistemi var.

Layman baxımından məlumat elmi, böyük və ya kiçik olaraq məlumatla nə edəcəyinizi dərk edən bir elmdir. İndiyə qədər yalnız balları orta hesablamağa çalışdıq, ancaq bir məlumat alimi də orta ilə nəyin əldə olunacağını tapmaq yollarına baxdı. Bir təşkilat üçün, onlara iş qərarları verməyə və menecerlərə daha yaxşı qərar verməyə və mənfəət artırmaq üçün qaynaqlar ayırmağa kömək edən nümunələri tapmağa kömək edir. Əksər məlumat alimləri böyük məlumatlarla maraqlanmasalar belə Hadoop-dan istifadə edə bilməzlər. Hesablamaları üçün ümumiyyətlə R lang və ya Python istifadə edirlər.

Böyük məlumatlar bir anlayışdır. Hadoop bir vasitədir. Məlumat elmi kompüter elminin bir sahəsidir.