Ngày 3 - Học về sự tiến hóa của Big Data

Ngày 3 - Học về sự tiến hóa của Big Data

Dữ liệu được lưu trong các tập tin văn bản thường không chứa cấu trúc (flat file). Không có khả năng truy xuất dữ liệu hiệu quả và việc tích hợp dữ liệu không thể thực hiện khi không có bất kỳ mô hình hay cấu trúc xung quanh. Dữ liệu lưu trong flat file sẽ gặp vấn đề về khai thác trong thời đại ngày nay. Nó như một cơn ác mộng khi có bất kỳ xử lý dữ liệu trong ứng dụng. Mặc dù các ứng dụng được phát triển tại thời điểm đó là phù hợp với sự phát triển của kỹ thuật và dữ liệu.

>> Ngày 2 – Học Big Data, So sánh Volume, Velocity và Variety

>> Thời đại Big Data - Amazon đạt doanh thu tới 74 tỷ USD

Edgar F Codd và 12 quy luật

Edgar_F_Code_and_12_Rules

Edgar Codd Frank là nhà khoa học máy tính người Anh, trong khi làm việc cho IBM, đã phát minh mô hình quan hệ quản lý cơ sở dữ liệu, cơ sở lý thuyết cho cơ sở dữ liệu quan hệ. Ông đã trình bày 12 quy tắc cho cơ sở dữ liệu quan hệ và đột nhiên sự hỗn loại của thế giới dữ liệu trở nên có quy tắc, kỹ luật. Cơ sở dữ liệu quan hệ là một vùng đất đầy hứa hẹn cho tất cả những người dùng cơ sở dữ liệu không có cấu trúc. Cơ sở dữ liệu quan hệ mang đến mối quan hệ giữa dữ liệu cũng như cải thiện hiệu suất truy xuất dữ liệu.

Cơ sở dữ liệu quan hệ

Kể từ khi Edgar F Codd đề xuất 12 quy tắc cho RDBMS, có nhiều nhà cung cấp khác nhau bắt đầu xây dựng các ứng dụng và công cụ hỗ trợ mối quan hệ giữa cơ sở dữ liệu. Mô hình thực thể quan hệ (ER) cũng được phát triển để mô tả một cơ sở dữ liệu một cách trừu tượng.

Tăng trưởng dữ liệu rất lớn

Tất cả mọi thứ có vẻ tốt đẹp với RDBMS trong thế giới cơ sở dữ liệu. Các ứng dụng và công cụ cho RDBMS giúp cuộc sống của nhà phát triển dễ dàng hơn rất nhiều. Do sự phổ biến và dễ dàng cài đặt của RDBMS, hầu như mọi dữ liệu đều được lưu trữ trong RDBMS. Các ứng dụng thời đại mới được xây dựng phương tiện truyền thông xã hội phát triển nhanh. Mỗi tổ chức đều có áp lực trong việc cung cấp trải nghiệm tốt hơn cho người dùng dựa trên dữ liệu hiện có.

Data Warehousing

Sự tăng trưởng dữ liệu khổng lồ hiện tại đang tạo ra thách thức lớn cho các tổ chức, những người muốn xây dựng hệ thống thông minh dựa trên dữ liệu và cung cấp trải nghiệm người dùng theo thời gian thực cho khách hàng. Các tổ chức khác nhau ngay lập tức bắt đầu xây dựng giải pháp kho dữ liệu, nơi dữ liệu được lưu trữ và xử lý. Xu hướng kinh doanh thông minh (business intelligence) đã trở thành nhu cầu hàng ngày. Dữ liệu nhận được từ hệ thống giao dịch qua đêm sẽ được sử lý để xây dựng báo cáo thông minh. Mặc dù đây là 1 giải pháp tuyệt vời, nó cung đem đến nhiều thách thức. Mô hình cơ sở dữ liệu quan hệ và các khái nhiệm kho dữ liệu tất cả đều được xây dựng dựa trên mô hình cơ sở dữ liệu quan hệ truyền thống, vốn đã có trong tâm trí và vẫn còn nhiều thách thức khi đã có sự xuất hiện của dữ liệu không có cấu trúc.

Thách thức thú vị

Interesting_Challenge

Mỗi tổ chức đều có chuyên môn để quản lý dữ liệu có cấu trúc nhưng thế giới đã thay đổi thêm dữ liệu không có cấu trúc. Có thông tin thông minh trong video, photo, SMS, text, các tin nhắn mạng xã hội,… Tất cả những điều này cần phải mang đến 1 nền tảng duy nhất và xây dựng 1 hệ thống thống nhất  cho những gì doanh nghiệp cần. Cách chúng ta làm kinh doanh cũng đã thay đổi. Có 1 thời gian khi người dùng chỉ dùng những tính năng mà công nghệ hỗ trợ, tuy nhiên, bây giờ người dùng yêu cầu những tính năng và công nghệ phải được xây dựng để hỗ trợ. Nhu cầu ứng dụng thông minh thời gian thực từ các luồng dữ liệu tốc độ nhanh đang trở thành cần thiết.

Một lượng lớn (volume) dữ liệu tốc độ cao (Velocity) khác nhau (Variety) là các thuộc tính của dữ liệu. Hệ thống cơ sở dữ liệu truyền thống có giới hạn khi giải quyết các thách thức mới. Đây là nhu cầu của khoa học big data. Chúng ta cần đổi mới cách xử lý và quản lý dữ liệu. Chúng ta cần những cách sáng tạo để thu thập dữ liệu và trình bày cho người dùng.

Bạn thấy bài viết này như thế nào?: 
Average: 5 (2 votes)
Ảnh của Tommy Tran

Tommy Tran owner Express Magazine

Drupal Developer having 9+ year experience, implementation and having strong knowledge of technical specifications, workflow development. Ability to perform effectively and efficiently in team and individually. Always enthusiastic and interseted to study new technologies

  • Skype ID: tthanhthuy
  • Phone/Zalo: (+84) 944 225 212
  • WhatsApp: (+84) 944 225 212
  • Line Messenger: (+84) 944 225 212
  • Email: asaleotestf@gmail.com
  • Telegram Messenger: https:/t.me/tommytran0401

Quảng cáo việc làm

 

Thích hợp các bạn nữ mảng thợ may làm việc tại nước NGA

Đơn hàng Tuyển dụng 100 Thợ may đi Nga(đợt 1 tháng 3.2021, đợt 2 tháng 5.2021). Lương thực lãnh 800 USD, bao ăn ở, vé máy bay và visa, phí xuất cảnh(1800 USD)trả khi đi làm có lương. Bạn có thể liên hệ CÔNG TY qua Phone/Zalo: (+84) 944 225 212. Công ty sẽ tư vấn cho bạn.

Xem chi tiết: >>> https://bit.ly/3o9NOfR

Tìm kiếm bất động sản

 

Advertisement

 

jobsora

Dich vu khu trung tphcm

Dich vu diet chuot tphcm

Dich vu diet con trung

Quảng Cáo Bài Viết

 
HP: tablet webOS sẽ trở lại vào năm 2013

HP: tablet webOS sẽ trở lại vào năm 2013

Giám đốc điều hành của HP Meg Whitman cuối cùng cũng chính thức cho công bố số phận của hệ điều hành webOS sau khi công ty công bố ngừng phát triển smartphone và tablet chạy nền tảng webOS trước đó.

Deepnet Explorer

10 browser đang được sử dụng nhiều nhất hiện nay

Gần đây, các hãng phát hành liên tục tung ra những phiên bản mới, cùng những công nghệ riêng, khiến cho cuộc chiến tranh giành thị phần giữa các trình duyệt web trở nên khốc liệt. Dựa vào số lượng người dùng và tính năng, website TopTenReviews đã chọn ra 10 đại diện sáng giá nhất dưới đây.

Galaxy S, Galaxy S II và Galaxy Ace thoát án kiện cáo

Galaxy S, Galaxy S II và Galaxy Ace thoát án kiện cáo

Tại phiên tòa xét xử vụ kiện cáo vi phạm bản quyền đang diễn ra hết sức căng thẳng giữa Apple và Samsung, vị thẩm phán Lucy Koh vừa ra phán quyết các sản phẩm Samsung Galaxy S GT-i9000, Galaxy S II GT-i9100 và Galaxy Ace không còn là đối tượng sản phẩm liên quan đến vụ kiện nữa.