Lịch sử phát triển tối ưu hoá công cụ tìm kiếm - SEO

SEO - Google Yahoo MSN Search Engine Lịch sử phát triển tối ưu hoá công cụ tìm kiếm

Bài viết này Mạng Kết Nối Việt   sẽ cùng các bạn phân tích các kỹ thuật cơ bản về tối ưu hóa Website cho máy tìm kiếm qua các thời kỳ, các kỹ thuật không còn hiệu quả với các máy tìm kiếm cũng như những thủ thuật SEO được khuyến nghị sử dụng.

Lịch sử phát triển tối ưu hoá công cụ tìm kiếm - SEO

Giới thiệu chung

Một vài năm trước, việc đưa một trang web lên 10 thứ hạng đầu ở các bộ máy tìm kiếm không có gì phức tạp hơn là tối ưu hóa thẻ <title> và đưa vào các thẻ <meta> một vài từ khóa có liên quan với các thông tin được tìm kiếm trên mạng. Tuy nhiên, việc quá lạm dụng các thẻ <meta> này đã làm cho các kết quả tìm kiếm chỉ còn là một danh sách các trang web spam tràn ngập các từ khóa, thậm chí chẳng còn liên quan gì đến những gì người dùng đang tìm kiếm. Kết quả là các bộ máy tìm kiếm buộc phải thay đổi thuật toán của mình nhằm đưa ra các kết quả chính xác hơn.

Hiện nay, các thẻ <meta> thường rất ít hoặc thậm chí là không được quan tâm đến. Thay vào đó, quan trọng hơn là nội dung, thiết kế và cấu trúc của trang web, số lượng và vị trí của từ khóa cũng như tỉ lệ giữa các từ khóa với toàn nội dung của trang web. Thậm chí bộ máy tìm kiếm Google còn đánh giá trang web dựa trên số lượng và chất lượng các trang web khác có liên kết đến nó.

Các bộ máy tìm kiếm phát tán các robot hay còn gọi là spider trên mạng. Chúng sẽ theo các đường liên kết đi từ trang web này đến trang web khác để thu thập thông tin. Thông tin dễ nhất và cũng là nhiều nhất mà các robot này thu thập được là chữ, các nội dung, thông tin ở dạng ký tự trên trang web.

Từ việc phát minh và áp dụng nhiều thuật toán ngày càng hiệu quả và phức tạp của các bộ máy tìm kiếm, việc đưa một trang web lên các thứ hạng cao (SEO) đã không còn là đơn giản như trước, mà là một hoạt động có kế hoạch, đòi hỏi nhiều công sức và kỹ năng khác nhau.

Công tác SEO cần phải được tiến hành ngay từ giai đoạn lên kế hoạch xây dựng website. Bạn cần xem xét cẩn thận mọi chi tiết, từ thiết kế, cấu trúc của website, hệ thống các đường liên kết giữa các trang với nhau, việc sử dụng hợp lý frame, các trang web web động cũng như tất cả các ứng dụng Java hay Flash.

Chọn lựa từ khóa

Chọn lựa từ khóa là một bước rất quan trọng trong quá trình tiến hành SEO. Cơ bản, có 3 cách chính để tìm từ khóa:

Bạn cũng cần chú ý rằng, so với các từ khóa đơn lẻ, các cụm từ 2 – 3 chữ thường mang lại hiệu quả cao hơn, định hướng rõ ràng, chính xác hơn. Hơn nữa, mỗi trang trên website bạn cũng chỉ nên tập trung vào tối đa là 3 từ khóa để tránh làm sao lãng cả quá trình SEO của mình.

Hỏi tất cả bạn bè, đồng nghiệp, cộng sự của bạn mỗi người 5 từ khóa mà họ có thể sẽ dùng khi tìm kiếm những thông tin tương tự như thông tin cung cấp trên website của bạn. Đối chiếu các kết quả thu được, bạn sẽ biết mọi người thường nghĩ ngay đến từ hay cụm từ gì khi cần tìm những thông tin đó. Và nếu bạn có càng nhiều người để hỏi thì kết quả càng khả quan hơn.

Việc xem xét, phân tích kỹ lưỡng website của các đối thủ cạnh tranh (đặc biệt là thông tin ở các thẻ <title> và <meta> cũng là một phương pháp hữu hiệu). Điều này hoàn toàn không có gì sai vì bạn nên biết đối thủ của bạn cũng đã nghiên cứu website của bạn rất kỹ lưỡng. Biết người biết ta, trăm trận trăm thắng.

Tận dụng các công cụ và cơ sở dữ liệu trực tuyến về từ khóa. Chúng không chỉ cho bạn biết tần suất được sử dụng của mỗi từ khóa mà còn cung cấp cả những từ đồng nghĩa, những cách viết khác nhau hoặc các cụm từ có liên quan đến nội dung website của bạn.

Thiết kế Website

Thiết kế đóng vai trò rất quan trọng với SEO. Một trang web thiết kế đẹp và thân thiện với các bộ máy tìm kiếm là do nhiều nhân tố. Sau đây là một số nhân tố quan trọng nhất:

Chúng ta đã bàn về một trang web thân thiện với các bộ máy tìm kiếm. Vậy giờ hãy đi ngược laị, xem xét các yếu tố gây khó khăn cho các spider:

Chữ, càng nhiều chữ càng tốt. Một trang web chỉ có một hình ảnh chớp nháy thật to và các đường liên kết trong image map sẽ hoàn toàn biến mất trên các trang kết quả tìm kiếm. Các spider không thể đọc được chữ ghi trong các tập tin hình ảnh và cũng chẳng thể đi theo các đường liên kết trong image map và thế là trang web chẳng có gì để chúng lưu vào chỉ mục (index). Như vậy không có nghĩa là bạn không được sử dụng hình ảnh, flash hay các ứng dụng Java mà chỉ là hạn chế, chỉ sử dụng khi thật cần thiết. Nhưng thực ra bạn vẫn có thể thiết kế một trang web trông rất chuyên nghiệp chủ yếu chỉ bằng chữ.

Tận dụng các thẻ tiêu đề (<h1>, <h2> .v.v.). Những nội dung nằm trong các thẻ này được nhiều bộ máy tìm kiếm đánh giá khá cao. Chúng càng phát huy hiệu quả nếu được đặt gần thẻ <body>. Rất nhiều trang web phạm sai lầm khi dùng các tiêu đề bằng hình ảnh. Thực ra, với kiến thức về CSS, bạn vẫn dễ dàng tạo ra một tiêu đềbằng chữ (phù hợp với các spider) mà không hề làm xấu đi thiết kế của trang web.

Bên cạnh các thẻ tiêu đề, các thẻ định dạng chữ như <b>, <i>, <strong> .v.v. cũng rất có giá trị. Tuy nhiên, đừng quá lạm dụng những thẻ này nếu bạn không muốn phá hỏng hoản toàn thiết kế của trang web. Nói chung, các từ khóa quan trọng trên trang web chỉ cần in đậm hay nghiệng một hoặc hai lần.

Các bộ máy tìm kiếm cũng rất quan tâm đến các từ khóa xuất hiện trong các đường liên kết (anchor text – nội dung nằm trong thẻ <a>). Do đó, bạn nên tận dụng để đưa các từ khóa vào các đường liên kết và tránh sử dụng các đường liên kết hình ảnh.

Trang web sử dụng khung (frame): Trang web dạng này bố trí, chia nội dung ra thành từng vùng có thể cuộn cửa sổ theo chiều dọc hoặc ngang (scrollable).VD:

...
<frameset cols="240,*" frameborder="yes" border="1" framespacing="3">
<frame src="http://album.aevn.fr/sinh_vien/arbre.php" name="tree" scrolling="" >
 <frame src="http://album.aevn.fr/sinh_vien/list.php" name="main" >
</frameset>
<noframes><body>
Trình duyệt của bạn không hỗ trợ sử dụng khung
	<a href="http://album.aevn.fr"><H1>Album anh thanh vien - Hoi sinh vien</H1></a>
</body></noframes>

Trong ví dụ trên, dàng chữ in đậm là nội dung duy nhất mà các spider đọc được bất kể những nội dung thông tin đa dạng, hữu ích mà bạn cung cấp trong các khung. tuy vẫn có cách để tối ưu hóa một trang web sử dụng khung nhưng chúng vẫn khó mà địch nổi những trang không dùng khung.

Trang web bằng flash cũng nảy sinh vấn đề tương tự như trang web dùng khung. Các spider cũng không có đủ thông tin để thu thập và không thể đi theo các đường liên kết (theo tôi biết, hiện chỉ có Google và AllTheWeb là có thể theo các liên kết trong tập tin flash). Nếu sử dụng flash, bạn nên load chúng bàng javascript và cố gắng tối ưu thông tin trong thẻ <noscript>. hiệu quả hơn, bạn có thể tạo ra hai phiên bản website, một thân thiện với các bộ máy tìm kiếm, một sử dụng flash – đẹp và thân thiện với người dùng. Cuối cùng, bạn cần nhớ là flash chỉ nên là một công cụ hỗ trợ một website chứ không phải là chính website.

Cấu trúc của website

Thông thường bạn không nên dồn tất cả các trang web vào một thư mục. Thay vào đó, bạn nên bố trí cấu trúc website (directory tree) đơn giản theo chiều ngang. Không nên bố trí cấu trúc website theo chiều đứng, quá sâu hay quá phức tạp vì bạn sẽ gây rất nhiều khó khăn cho các spider. Thực ra spider của nhiều bộ máy tìm kiếm chỉ đi sâu đến 2 – 3 lớp thư mục mà thôi và chúng sẽ không thề xem xét và lập chỉ mục các trang web nằm quá sâu. Các thư mục nên được bố trí và đặt tên theo từng phần nội dung. Nói cách khác, bạn nên dùng các từ khóa liên quan đến nội dung để đặt tên cho các thư mục và trang web. Điều này sẽ rất có ích vì các đường liên kết nội bộ của bạn mặc nhiên sẽ chứa các từ khóa quan trọng.

Tất cả các trang web của bạn nền được liên kết qua lại lẫn nhau và cách mà bạn liên kết chúng lại có ảnh hưởng rất lớn. Bạn nên dùng đường liên kết dạng chữ (anchor text) thay vì hình ảnh.

Nếu có dùng hình ảnh liên kết thì tránh dùng image map và luôn chú ý cung cấp thuộc tính ALT miêu tả về nội dung của hình ảnh, nội dung trang web mà nó liên kết đến.

Trong trường hợp bạn buộc phải dùng image map để tạo menu cho website, Bạn nên cũng cấp thêm một phương án khác cho các spider như tạo thêm một menu chữ ở cuối trang.

Các đường liên kết đến các website khác được đánh giá cao nhưng bạn không nên đặt quá nhiều liên kết ra ngoài (giới hạn tối đa của Google là không quá 100 liên kết) nếu không muốn bị các bộ máy tìm kiếm bỏ qua. Các đường liên kết ra ngoài cũng nên có thuộc tính để mô tả chúng.

Thuật toán gần đây nhất được các bộ máy tìm kiếm bổ sung là để đếm và đánh giá các đường liên kết từ ngoài đền trang web của bạn (Google PageRank). Số lượng trang web liên kết đến trang web của bạn càng nhiều và các trang web đó càng có chất lượng thì nghĩa là nội dung trên trang web của bạn càng có giá trị.

Trong trường hợp Google PageRank, việc đánh giá chất lượng của các trang web có liên kết đến trang web của bạn thường theo 3 cách:

  • Nội dung trang web đó có liên quan, gần gũi với nội dung trên trang web của bạn không?
  • Điểm số PageRank của trang web đó cao hay thấp?
  • Trên trang web đó, ngoài đường liên kết đến trang web của bạn, còn có bao nhiêu đường liên kết đến các trang web khác (càng nhiều đường liên kết đến các trang web khác sẽ làm giảm bớt PageRank mà trang web đó mang đền cho bạn)?

Có nhiều cách để làm tăng số lượng liên kết từ bên ngoài vào như trao đổi liên kết .v.v. nhưng cách cơ bản và quan trong nhất để có những trang liên kết chất lượng từ ngoài vào chính là tạo một website có nội dung thật sự giá trị. Bạn nên tránh phung phí thời gian trao đổi liên kết với những trang web cung cấp thông tin vớ vẫn hay chỉ là danh sách đường liên kết (link farm) nếu không muốn bị ghi vào sổ đen của các bộ máy tìm kiếm.

Mã nguồn (HTML)

Các từ khóa không chỉ quan trọng ở vệc xuất hiện bao nhiêu lần mà còn ở vị trí của chúng trong mã nguồn của trang web. Bạn nên tìm mọi cách có thể để đưa các từ khóa lên càng cao càng tốt nhằm giúp các spider tìm thấy chúng nhanh nhất cũng như tránh các các mã Javascript và CSS (Cascading Style Sheet) gây trở ngại cho chúng. Mặc dù các từ khóa xuất hiện ở cuối mã nguồn cũng như trên toàn trang web cũng rất quan trọng nhưng phần đầu luôn được xem xét trước hết và các thẻ đặc biệt ở phần HEADnhư thẻ <title> hay các thẻ <meta> là rất quan trọng. Thông thường, thẻ <title> có 6 – 7 chữ trong đó chứa khoảng 3 từ khóa quan trọng.

Trong phần BODY, bạn nên tận dụng các thẻ tiêu đề <h1>, <h2>. Nếu chúng trông quá to hay không hợp với thiết kế của trang web, bạn có thể định dạng lại bằng cách sử dụng CSS. Sau tiêu đề, trong phần nội dung chính của trang web, đừng bố trí các từ khóa quá dày đặc. Thường trong 100 chữ không nên chứa đến 15% là từ khóa. Tuy nhiên, cần lưu ý là các từ khóa này vẫn phải thích hợp với nội dung. Các từ khóa xuất hiện liên tục một cách vô cớ hoặc không hợp nghĩa sẽ làm trang web của bạn bị các bộ máy tìm kiếm xem là spam. Phần đầu hoặc 100 – 150 chữ đầu là rất quan trọng. Bạn nên cố gắng bố trí các từ khóa chính xuất hiện càng sớm càng tốt ở đoạn này.

Phần nội dung tiếp theo đương nhiên rải rác vẫn có các từ khóa nhưng sẽ không quan trọng bằng đoạn đầu tiên. Các từ khóa có thể in đậm (<b>) hoặc in nghiêng (<i>) một vài lần, miễn là trông chúng đừng quá dị hợm trong tổng thể toàn trang web. Nếu bạn có sử dụng hình ảnh thì nhớ thêm thuộc tính alt cho mỗi hình (như đã nói trong phần thiết kế) và đừng dùng cùng một từ làm alt cho nhiều hình khác nhau. Nếu hình ảnh của bạn có liên kết đến trang khác, bạn có thể dùng thuộc tính title của liên kết thay cho thuộc tính alt của hình ảnh.

Khi viết mã nguồn, bạn nên nhớ cách mà chúng ta xem, đọc một trang web khác hẵn với cách của các spider. Những nội dung đầu tiên mà ta thấy ở phần đầu chưa hẳn là những gì mà các spider sẽ đọc thấy ở phần đầu. Chẳng hạn trong trường hợp trang web của bạn sử dụng bảng bố trí một phần nội dung phụ (side bar – chẳng hạn như menu) nằm dọc ở cột bên trái và phần nội dung chính ở cột bên phải. Chúng ta sẽ nhanh chóng hiểu và đọc phần nội dung chính ở cột phải và chỉ quan tâm đến cột trai khi cần dùng đến menu để đi đến các trang khác, phần khác của website. Tuy nhiên khi bố trí như vậy, mã nguồn của bạn sẽ như sau:

<table style="height: 22px;" border="0" width="172">
<tbody>
<tr>
<td>Nội dung phụ</td>
<td>Nội dung chính</td>
</tr>
</tbody></table>

Như vậy, khi đọc mã nguồn trang web của bạn, những gì mà các spider nhìn thấy đầu tiên lại chính những nội dung phụ nằm ở cột trái chứ không phải phần nội dung chính của trang web. Do vậy, phần đầu tiên quan trọng trong mã nguồn để chứa các từ khóa chính lại là phần nội dung phụ này. Tuy bạn có thể bố trí các từ khóa quan trọng ở đây, nhưng thường sẽ khó khăn hơn vì chúng chỉ là các thông tin phụ và thường là menu của website.

Tuy vậy, vẫn có nhiều mưu mẹo trong cách vết mã HTML để phần nội dung chính vẫn là phần xuất hiện đầu tiên trong mã nguồn của trang web (1). Còn trường hợp trang web bạn sử dụng khung (frameset) như đã nói ở phần thiết kế, người ghé thăm trang web của bạn sẽ thấy các nội dung trong các trang được bố trí trong các khung, nhưng ngược lại, những gì mà các spider đọc được chỉ là những gì nằm trong thẻ <noframe>.Do vậy, bạn cần cung cấp thông tin đã tối ưu hóa bên trong thẻ <noframe> cho các spider. Cũng cần lưu ý là các spider đa số không có cách gì tiếp cận các trang web con mà bạn đặt trong các khung. Vì vậy bạn cần đặt liên kết trong thẻ <noframe> để các spider theo đó đến các trang web nay. Tuy nhiên, vẫn còn những vấn đề nhất định đối với những trang sử dụng khung, chẳng hạn như khi được tìm kiếm và một trang web con của bạn xuất hiện và người dùng click chuột ghé thăm. Trang web con này lẽ ra xuất hiện trong một khung nào đó của một trang web khác nhưng giờ lại hiển thị một mình và nó sẽ chẳng có menu hay thậm chí chẳng thể liên kết đến đâu trong website của bạn.

Đăng ký vào các bộ máy tìm kiếm (Submission)

Thông thường có 2 cách đăng ký vào các bộ máy tìm kiếm.

Thường thì tốt nhất nên đăng ký 3 trang gồm trang chủ, trang sơ đồ website (sitemap) và một trang quan trọng khác (chẳng hạn như trang chi tiết sản phẩm). Trang sơ đồ website cũng rất quan trọng. Nó sẽ hỗ trợ các spider rất nhiều trong quá trình theo các đường liên kết để xem xét tất cả các trang trên website của bạn.

Cuối cùng, 90% lưu lượng truy cập website của bạn có thể đến từ chỉ một số bộ máy tìm kiếm chính và lớn nhất. Do đó, bạn nên tự tay đăng ký ở những bộ máy tìm kiếm này. Còn vô vàn các bộ máy tìm kiếm nhỏ khác bạn nên dùng phần mềm hay dịch vụ tự động trực tuyến để tiết kiệm thời gian.

Bạn có thể sử dụng phần mềm hoặc các công cự trực tuyến để đăng ký tự động. Cách này tiết kiệm được rất nhiều thời gian và công sức. Bạn chỉ phải nhập thông tin về website của mình 1 lần duy nhất và đăng ký vào các bộ máy tìm kiếm cả lớn lẫn bé. Tuy nhiên, Ngày càng có nhiều bộ máy tìm kiếm lớn không thích các công cụ tự động và không cho phép đăng ký tự động. Cũng có thể phần mềm hay dịch vụ trực tuyến đó cập nhật không thường xuyên thông tin về các bộ máy tìm kiếm và kết quả là bạn đăng ký không đúng địa chỉ. Hơn nữa, đăng ký cách này bạn hoàn toàn không biết kết quả thế nào.

Nếu bạn tự mình đăng ký thì sẽ mất nhiều thời gian và công sức hơn. Nhưng đây lại là cách làm hiệu quả hơn và các bộ máy tìm kiếm cũng ưu ái hơn. Khi đăng ký, bạn nên xem kỹ hướng dẫn và các quy định (guidelines) vì đôi lúc có những sai sót nhỏ lại làm cho bộ máy tìm kiếm xem website của bạn là spam. Khi được yêu cầu mô tả về website, bạn nên viết một mô ta ngắn gọn có sử dụng các từ khóa quan trọng chứ không chỉ đơn thuần là một danh sách các từ khóa.