Ý tưởng về 6 bậc cách biệt và mô hình đồ thị (6 degrees of Separation and Graph model)

Bài này dành cho mấy đứa cô đơn để mấy đứa thấy thể giới bé cỡ nào, mùa đông nhưng thấy bạn bè mình nhiều đứa chia tay quá. 

“I read somewhere that everybody on this planet is separated by only six other people. Six degrees of separation. Between us and everybody else on this planet. The president of the United States. A gondolier in Venice. Fill in the names. . . . How every person is a new door, opening up into other worlds. Six degrees of separation between me and everyone else on this planet. But to find the right six people . . .”

– John Guare, Six Degrees of Separation (1990)

6 bậc cách biệt – lần đầu tiên tôi biết đến khái niệm này là thông qua cuốn Quảng trường và tòa tháp của tác giả Niall Ferguson. Ý tưởng về 6 bậc cách biệt là mỗi người chúng ta có thể kết nối với bất kỳ ai thông qua không quá 5 người quen với điều kiện là bạn chỉ cần biết cụ thể một người trong số họ. 

Con số 6 này đã được nhà xã hội học Stanley Milgram “đo đạc” được thông qua một thí nghiệm như sau: 

Đầu tiên ông gửi thư cho những người được chọn ngẫu nhiên ở 4 bang của Mỹ gồm Wichita, Kansas, Omaha, Nebraska. Tiếp theo yêu cầu họ chuyển bức thư đến người nhận cuối cùng đã định trước bằng 2 cách: chuyển trực tiếp hoặc thông qua những người thân với họ mà họ tin là có thể biết người nhận.Đồng thời ông nhờ họ gửi cho ông tấm thiếp kể lại họ đã làm gì với lá thư.  Kết quả có 44 trên tổng số 66 thư từ Nebraska đến được địa chỉ cuối cùng. Và Milgram tính được số bước trung gian cần thiết để thư đến được đích: trung bình là năm.

Cùng với sự phát triển của công nghệ, khoảng cách giữa chúng ta dường như đã được rút ngắn lại cả về mặt định tính cũng như định lượng. Mạng xã hội cùng với những phát minh khác ra đời đã giúp việc kết nối giữa người với người dễ dàng hơn và vào năm 2016 số bậc cách biệt mà Facebook tính toán được là 3.57 trong năm 2016. 

Những tính toán trên là một trong những ví dụ về việc quan sát cách mà thông tin được lan truyền. Ngày nay, một số bài toán tương tự mà các nhà khoa học dữ liệu gặp phải như tính toán tốc độ lây truyền của dịch bệnh, hay hiệu ứng lan truyền của một #hashtag trên mạng xã hội. Điều này mở ra các hướng nghiên cứu mới liên quan đến xã hội học bằng cách áp dụng các kiến thức về lý thuyết đồ thị và lý thuyết mạng. Đồng thời sự xuất hiện của một mô hình dữ liệu mới là Graph model. 

A map of several branches and degrees of a small social group: Ryan is six degrees of separation from Arnold

A map of several branches and degrees of a small social group: Ryan is six degrees of separation from Arnold

Graph model được biểu diễn dưới dạng đồ thị gồm có các nút (node, point)  biểu thị cho một đối tượng và cạnh (edge) dùng để nối hai nút có liên quan trực tiếp với nhau.

Như minh họa ở hình trên, một nút đại diện cho một người và các đường nối hai nút thể hiện giữ hai người đó quen biết nhau (là bạn bè của nhau). 

So với biểu diễn mối quan hệ người – người bằng mô hình dữ liệu quan hệ (Relational model) thông qua các bảng và phép toán (join) thì sử dụng mô hình đồ thị giúp chúng ta có cái nhìn trực quan hơn. 

Trong thực tế, mô hình đồ thị không chỉ dùng để biểu diễn mối quan hệ người – người trong xã hội mà nó còn được áp dụng nhiều trong biểu diễn các hệ thống, thông tin địa lý, giao thông, vân vân …

Ở những bài tiếp theo mình nghĩ mình sẽ trả lời câu hỏi khi nào nên dùng relational model và khi nào nên dùng graph model và đồng thời áp dụng graph model để trực quan hóa vòng tròn bạn bè trên Facebook để tìm được “6 right persons” :D.

Fivestar: 
No votes yet