Ngày 2 – Học Big Data, So sánh Volume, Velocity và Variety

Ngày 2 – Học Big Data, So sánh Volume, Velocity và Variety

Dữ liệu là mãi mãi, đây là sự thật. Bạn có đang dùng 1 ứng dụng được xây dựng cách đây 10 năm? Bạn có đang dùng các phần cứng được tạo ra cách đây 10 năm? Câu trả lời đa phần là không. Tuy nhiên, nếu hỏi – bạn có đang dùng dữ liệu đã có cách đây 50 năm? câu trả lời chắc chắn là có. Ví dụ, nhìn vào lịch sử của dân tộc, hay như dữ liệu ngày sinh nhật của chúng ta – ít nhất chúng ta cũng đang sử dụng nó đến ngày hôm nay. Dữ liệu không bao giờ cũ và nó sẽ được lưu giữ mãi.

Các tổ chức ngày càng phát triển, dữ liệu liên quan cũng phát triển và ngày càng phức tạp hơn. Hầu hết các tổ chức lớn đều có dữ liệu trong nhiều ứng dụng và định dạng khác nhau. Dữ liệu dàn trải rất khó để phân loại với chỉ 1 thuật toán duy nhất. Cuộc cách mạng di động đã hoàn toàn thay đổi cách chúng ta thu thập dữ liệu và xây dựng các hệ thống thông minh. Các tổ chức lớn đang thực sự đối mặt với thách thức để giữ tất cả dữ liệu trên một nền tảng để cho họ một cái nhìn nhất quán tất cả dữ liệu đang có.

Định nghĩa Big Data

3Vs để định nghĩa big data là Variety, Velocity và Volume.

https://dinhnguyenngoc.files.wordpress.com/2014/07/3vs_of_bigdata.png

Volume (Khối lượng)

Hiện tại, chúng ta đang thấy rằng việc lưu trữ dữ liệu (khối lượng) đang tăng trưởng theo cấp số nhân chứ không chỉ đơn thuần là dữ liệu văn bản. Chúng ta có thể tìm thấy dữ liệu trong các định dạng video, music, image lớn trên các kênh truyền thông xã hội. Khối lượng dữ liệu ngày nay có thể lên đến hàng Terabyte và Petabyte. Khối lượng dữ liệu ngày càng phát triển thì các ứng dụng và kiến trúc xây dựng để hỗ trợ dữ liệu cần phải được đánh giá lại khá thường xuyên. Khối lượng lớn dữ liệu thực sự đại diện cho big data.

Velocity (Vận tốc)

Sự tăng trưởng dữ liệu và các phương tiện truyền thông xã hội đã thay đổi cách chúng ta nhìn vào dữ liệu. Có một thời gian khi chúng ta từng tin rằng dữ liệu của ngày hôm qua là gần đây. Vấn đề này với các tờ báo thì vẫn còn hợp lý. Tuy nhiên, các kênh tin tức và radio đã thay đổi rất nhanh (tốc độ) chúng ta nhận được tin tức.  Ngày nay, mọi người trả lời trên kênh truyền thông xã hội để cập nhật những diễn biến mới nhất. Trên phương tiện truyền thông xã hội đôi khi các thông báo cách đó vài giây (tweet, status,….) đã là cũ và không được người dùng quan tâm. Họ thường loại bỏ các tin nhắn cũ và chỉ chú ý đến các cập nhật gần nhất. Sự chuyển động của dữ liệu bây giờ hầu như là thực tế (real time) và tốc độ cập nhật thông tin đã giảm xuống đơn vị hàng mili giây. Vận tốc dữ liệu cao đại diện cho big data.

Variety (Đa dạng)

Dữ liệu có thể được lưu trữ trong nhiều định dạng khác nhau. Ví dụ như: cơ sở dữ liệu, excel, csv, ms access hoặc thậm chí là tập tin văn bản (text). Đôi khi dữ liệu không ở dạng truyền thống như video, sms, pdf,… Điều cần làm của các tổ chức là sắp xếp và làm cho dữ liệu có ý nghĩa. Sẽ dễ dàng để làm điều này nếu dữ liệu có chung 1 định dạng, nhưng thường là không. Thực tế dữ liệu thuộc nhiều định dạng và đó là thách thức của chúng ta. Sự đa dạng của dữ liệu đại diện cho big data.

Big Data nói theo cách đơn giản

Big Data không chỉ là có rất nhiều dữ liệu, nó thật sự là 1 khái niệm cung cấp 1 cơ hội để có cái nhìn sâu sắc vào dữ liệu hiện có cũng như các hướng dẫn để thu thập và phân tích dữ liệu tương lai. Nó làm cho các tổ chức kinh doanh thông minh và mạnh mẽ hơn để có thể thích nghi và vượt qua các thánh thức kinh doanh.

Bạn thấy bài viết này như thế nào?: 
Average: 5 (1 vote)
Ảnh của Tommy Tran

Tommy owner Express Magazine

Drupal Developer having 9+ year experience, implementation and having strong knowledge of technical specifications, workflow development. Ability to perform effectively and efficiently in team and individually. Always enthusiastic and interseted to study new technologies

  • Skype ID: tthanhthuy

Tìm kiếm bất động sản

 

Advertisement

 

jobsora

Dich vu khu trung tphcm

Dich vu diet chuot tphcm

Dich vu diet con trung

Quảng Cáo Bài Viết

 
drush redfin-db: hiển thị thông tin connect Database

drush redfin-db: hiển thị thông tin connect Database

Here at Redfin we've come up with a couple of helpful Drush commands that help us with our everyday workflows.

10 ứng dụng nằm top chỉnh sửa ảnh tốt nhất năm 2014 sắp tới

Bạn đang cần tìm một phần mềm chỉnh sửa ảnh để cài đặt trên máy tính nhưng không biết phần mềm nào mới là tốt và tốt ở điểm gì? Bài viết dưới đây là 10 ứng dụng chỉnh sửa ảnh tốt nhất năm 2014 được tạp chí uy tín toptenreviews.com công bố dựa theo kết quả bình chọn của người dùng trên khắp thế giới.

Hướng dẫn cài đặt LiteSpeed, PHP, MySQL và phpMyAdmin trên Ubuntu/Debian

Hướng dẫn cài đặt LiteSpeed, PHP, MySQL và phpMyAdmin trên Ubuntu/Debian

Bài viết sẽ hướng dẫn các bạn cài đặt LiteSpeed và MySQL cùng với việc xây dựng PHP tùy biến, và phpMyAdmin để quản lí database trên MySQL trên hệ điều hành họ Ubuntu/Debian một cách đầy đủ.

Công ty diệt chuột T&C

 

Diet con trung