10 lời khuyên để website của bạn thân thiện với các spider


ho tro seo - 10 loi khuyen Spider Friendly SiteHotroseo.com - Spider nghĩa là gì? Spider hay còn gọi là bot hoặc crawler, là những chương trình tự động mà các bộ máy tìm kiếm sử dụng để thu thập thông tin về các website trên mạng internet. Chúng sẽ cào qua (crawl) danh sách các từ tìm thấy trên các website. Những từ này có thể là từ khóa để người dùng tìm thấy được những thông tin mà họ đã tìm kiếm.
Các spider này sẽ bắt đầu crawl từ những website phổ biến nhất. Chúng sẽ bắt đầu xây dựng danh sách các keyword và mở rộng tìm kiếm bằng cách follow theo mỗi link trên mỗi site. Nếu có một link trỏ về website của bạn ở bất cứ đâu trên internet, các spider đều biết được và tìm thấy bạn ngay.

Mỗi bộ máy tìm kiếm đều có các quy định và tiêu chuẩn riêng của nó, tuy nhiên quá trình thực hiện thì đa số là giống nhau. Các spider chỉ có thể đọc được các nội dung text và chúng không thể click vào các button hay sử dụng các menu. Đó là những giới hạn của chúng.

Một khi các spider nhận được thông tin, chúng sẽ chứa những thông tin này trong một database, các bộ máy tìm kiếm sẽ sử dụng database này để quyết định ranking cho website của bạn. Thông tin này là những gì mà người dùng tìm kiếm khi họ sử dụng các từ khóa để tìm trang web.

Với những khái niệm trên, chắc hẳn rằng bạn muốn website của mình tối ưu đối với các spider này. Dưới đây là những điều mà bạn có thể làm để lôi cuốn các spider viếng thăm website của bạn.

Những thứ mà spider mong muốn:
1. File robots.txt
Điều đầu tiên mà các spider sẽ tìm trong website của bạn là file robots.txt. File này sẽ cho các spider biết trang nào trong website của bạn mà chúng không cần phải quan tâm. Tất cả các website đều nên có file này ngay cả nếu đó là website rỗng, bởi vì đây là điều đầu tiên mà các spider sẽ tìm kiếm. File robots.txt không chỉ để các spider biết được những thứ chúng không cần phải tìm, mà nó giống như 1 lời mời các spider viếng thăm website của bạn vậy.

2. Head Section
Khi các spider tìm thấy file robots.txt, chúng sẽ di chuyển tới phần head section của website. Tại đây chúng sẽ tìm kiếm tiêu đề, các thẻ meta, và các từ khóa. Bạn nên đảm bảo rằng tiêu đề nên có từ khóa trong đó và không nên quá dài, khoảng từ 60, 70 kí tự là tốt. Thẻ meta description sẽ cho các spider biết là website của bạn nói về điều gì. Bạn nên viết description rõ ràng, súc tích và có chứa keyword trong đó.  Đây là những thứ sẽ hiển thị trên các bộ máy tìm kiếm khi người dùng tìm kiếm. Khi liệt kê các từ khóa, bạn nên đảm bảo rằng những từ này cũng sẽ có trong nội dung website của bạn. Bạn nên phân tích từ khóa để tìm ra những từ phù hợp nhất để sử dụng cho chủ đề website.

3. Website content
Tiếp theo các spider sẽ xem xét đến nội dung của website. Bạn nên viết nội dung cho website có chất lượng, update thường xuyên. Việc bạn update nội dung thường xuyên sẽ khuyến khích các spider viếng thăm website thường xuyên hơn.

4. Site Map
Site map của toàn bộ website sẽ giúp cho các spider dễ dàng di chuyển trong website và index được nhiều trang hơn. Site map chỉ nên chứa text liên kết đến tất cả các trang.

5. Backlinks
Backlink hoặc các inbound links rất quan trọng bởi vì chúng nâng cao tầm quan trọng website của bạn trong mắt các spider. Số lượng các backlink có chất lượng đến site của bạn sẽ được xem như là 1 yếu tố lớn khi xếp hạng site của bạn. Bạn luôn muốn những backlink từ các website tương tự như website của bạn và cũng có rank tốt. Nếu bạn tham gia vào việc trao đổi link, bạn nên cẩn thận chọn những website phù hợp, những link có chất lượng tốt.


Những thứ mà spider không mong muốn:
6. Javascript Navigation
Javascript có thể là 1 ý tưởng tốt để thiết kế website của bạn, nhưng thật không may là các spider không nhìn thấy nó. Nếu các link của bạn bị ẩn đối với các spider, chúng sẽ không thể crawl website và index các trang web của bạn được,do đó sẽ ảnh hưởng đến ranking trang web của bạn. Để giảm thiểu việc này, hoặc là không sử dụng javascript, hoặc là thêm các text links trên trang web của bạn.

7. Các trang Doorway
Các trang doorway là các trang web standalone được nhìn thấy duy nhất bởi các spider. Các trang doorway thường không có tác dụng và không thích hợp với người dùng. Do đó, các bộ máy tìm kiếm xem như bạn cố ý làm điều này và có thể sẽ cấm hoặc ban website của bạn.

8. Frames
Người dùng và các spider hầu như sẽ rời khỏi ngay những website được xây dựng bởi frame. Nó rất khó để di chuyển và cũng rất khó để đọc đối với các spider và cả người dùng. Các spider có thể sẽ chỉ xác định được mỗi trang chủ và như vậy sẽ không index đúng được các trang trong website. Có nhiều vấn đề liên quan tới việc này, tuy nhiên, tốt nhất là không nên sử dụng frame trong website của bạn.

9. Images
Các hình ảnh rất quan trọng đối với 1 website, tuy nhiên thật không may là các spider không thể đọc được hình ảnh hoặc là các text trong hình ảnh. Nếu một website mà không sử dụng hình ảnh thì rất là tệ, tuy nhiên, khi sử dụng website, bạn nên sử dụng thẻ ALT. Thẻ ALT là một cách để thêm text vào một hình ảnh để các spider có thể đọc được hình ảnh đó nói về cái gì.

10. Flash
Flash có thể làm cho website trở nên sinh động, mới lạ và thu hút người dùng nhưng các spider lại không thể đọc được hay hiểu được nó, do đó site của bạn sẽ không được index như mong muốn. Sử dụng một vài file flash trên các trang web thuần html thì ok, nhưng nếu toàn bộ website của bạn được xây dựng bởi flash thì traffic đến từ các bộ máy tìm kiếm là hầu như không có.

Tác giả: Mr.Chau243 (Theo SEO News)
Vui lòng ghi rõ nguồn Hỗ trợ SEO - www.hotroseo.com khi phát hành lại bài viết này

0 Bình luận:

Y kien dong gop cho Ho tro SEOÝ kiến của bạn!