Vấn đề trùng lặp nội dung trong Drupal

Vấn đề trùng lặp nội dung trong Drupal

Nói đến Drupal, một số có thể cho rằng nó quá phức tạp để phát triển website vì lý do những thuật ngữ được sử dụng trong drupal khác rất nhiều so với joomla và wordpress. Nhưng có 1 điều chúng ta phải thừa nhận rằng, trong thế giới SEO thì drupal sẻ là 1 lựa chọn hoàn hảo nhất cho việc phát triển webstie mã nguồn mở. Ngoài một bộ sườn uyển chuyển, drupal còn hỗ trợ rất tốt heading tag, tagling keyword là đặc biệt là url sef.

Nhưng vẫn còn đó một số vấn đề cần giải quyết đối với việc làm SEO cho  website drupal. Một vấn đề mà các bạn thường hay mắc phải nhất chính là trùng lặp nội dung (duplicate content), đặt biệt là với Drupal. Website drupal sử dụng khá nhiều các mặc định giúp tối ưu hóa công cụ tìm kiếm, những một số chức năng mặc định ấy chính là nguyên nhân dẫn đến việc duplicate content. Hy vọng rằng với một số thủ thuật nhỏ ở bài viết này, SEO Việt Nam sẻ giúp bạn giải quyết ổn thỏa vấn đề này.
Vấn đề duplicate của drupal:

Drupal SEO - Vấn đề vẫn là trung lặp nội dung (duplicate content)

Hãy nhìn vào 2 đường link dưới đây:

http://www.drupal.com/article/duplicate-content/

http://www.drupal.com/article/duplicate-content

Với một website drupal thông thường, được bất chức năng clear url thì việc tạo ra nhưng url vô cùng friendly như trên là hoàn toàn có thể. Những url kiểu này giúp ích rất nhiều trong cả việc SEO tối ưu hóa trên mạng tìm kiếm lẫn hạn chế lỗi 404 cho người đọc. Nhưng nó vẫn còn đó 1 vấn đề đó là duplicate, cả 2 url cùng cho ra 1 kết quả giống nhau, điều này có thể tốt cho người đọc những thật sự là ko tốt cho website của bạn 1 chút nào.

May thay, thủ thuật nhỏ với việc sử dụng .htaccess này sẻ giúp bạn loại bỏ hoàn toàn vấn đề trên. Redirect drupal với .htaccess:

Chắc hẳn các bạn đã phần nào hiểu được sức mạnh của .htaccess trong việc chuyển hướng server, tác dụng của .htaccess đã giúp những website joomla cũng như wordpress có thể tạo ra những url cực kì SEF giống SEO Việt Nam Wink

Và với drupal chúng ta cũng sẻ sử dụng .htaccess như một công cụ giúp tránh trùng lặp nội dung. Cách giải quyết ở đây là chúng ta sẻ chuyển hướng tất cả các url có dạng:

http://www.drupal.com/article/duplicate-content/

thành những url có dạng :

http://www.drupal.com/article/duplicate-content

Với việc sử dụng 301 redirect ở trường hợp này, chúng ta có thể yên tâm rằng sẻ ko còn tồn tại bất cứ link nào có dạng http://www.drupal.com/article/duplicate-content/ mà mọi truy vấn đến đường link này sẻ được tự động redirect về http://www.drupal.com/article/duplicate-content

Tất cả việc bạn cần làm là thêm đoạn code sau vào file .htaccess trên server:

#get rid of trailing slashes
RewriteCond %{HTTP_HOST} ^(www.)?seovietnam\.org$ [NC]
RewriteRule ^(.+)/$ http://%{HTTP_HOST}/ [R=301,L]

Tham khảo thêm bài viết: .htaccess và redirect 301. Sử dụng file robots.txt để ẩn đi nội dung trùng lặp:

Không chỉ có những url như trên, một website drupal còn có thể tồn tại thêm một dạng url như sau:

http://www.seovietnam.org/articles/duplicate-content
http://www.seovietnam.org/node/44

Và điều chúng ta cần làm trong trường hợp này là thêm đoạn code sau vào file robots.txt

Disallow: /node/

Việc làm này sẻ giúp chúng ta quy định các bọ tìm kiếm không quét nhứng phận nội dung trên thư mục /node/, vì vậy các bọ tìm kiếm sẻ ưu tiên index những url có cùng nội dùng khác thay vì url có chứa thư mục /node/

Đây sẻ không phải là vấn đề của bạn nến bạn sử dung module pathauto và Global Redirect, 2 module này sẻ giúp bạn trong việc loại bỏ url chứa biến /node/. Riêng về phần tôi thì tôi sẻ sử dụng chức năng của .htaccess và robots.txt thay vì những module mở rộng thêm, vì phần nào những module mở rộng cũng sẻ hạn chế một phần tốc độ của website bạn.

Hy vọng rằng với những thủ thuật nhỏ trong việc sử dụng .htaccess và robots.txt phía trên, sẻ phần nào giúp các bạn tối ưu hóa webiste drupal của mình tối hơn.

Tham khảo thêm các bài viết:

1. Cách tránh lỗi duplicate content.
2. Duplicate content và cách phát hiện mới của google.
3. Canonical - Hạn chế trùng lặp nội dung.

Chúc các bạn may mắn.

Bạn thấy bài viết này như thế nào?: 
Average: 5 (1 vote)
Ảnh của Thien To Bao

Thien To Bao

Full stack developer specialized in Front-end

Tìm kiếm bất động sản

 

Advertisement

 

jobsora

Dich vu khu trung tphcm

Dich vu diet chuot tphcm

Dich vu diet con trung

Quảng Cáo Bài Viết

 
Security Vulnerabilities Affect Your Dev Sites Too | mydropwizard.com

Security Vulnerabilities Affect Your Dev Sites Too | mydropwizard.com

Due to the nature of the vulnerability, from the largest of enterprise applications to the smallest of brochure or hobbyist site builds, all Drupal sites were affected.

Các bước khởi đầu để bạn Viết NodeJS

Bạn làm cho một số thứ chuyển động, thay đổi màu sắc, bạn làm cho mã HTML linh hoạt hơn, bạn thêm tag này, bỏ tag kia bằng js

Thủ thuật đếm total Number cho Disqus Comments trong Page in Drupal 7

Thủ thuật đếm total Number cho Disqus Comments trong Page in Drupal 7

On a recent project I had to show the total number of comments posted using Disqus for each node on a page. What the page did was loop through a bunch of nodes and render the teaser view of each node.

Công ty diệt chuột T&C

 

Diet con trung