Hotroseo.com - Spider nghĩa là gì? Spider hay còn gọi là bot hoặc crawler,
là những chương trình tự động mà các bộ máy tìm kiếm sử dụng để thu thập thông
tin về các website trên mạng internet. Chúng sẽ cào qua (crawl) danh sách các từ
tìm thấy trên các website. Những từ này có thể là từ khóa để người dùng tìm thấy
được những thông tin mà họ đã tìm kiếm.
Các spider này sẽ bắt đầu crawl từ những website phổ biến nhất.
Chúng sẽ bắt đầu xây dựng danh sách các keyword và mở rộng tìm kiếm bằng cách
follow theo mỗi link trên mỗi site. Nếu có một link trỏ về website của bạn ở bất
cứ đâu trên internet, các spider đều biết được và tìm thấy bạn ngay.
Mỗi bộ máy tìm kiếm đều có các quy định và tiêu chuẩn riêng của
nó, tuy nhiên quá trình thực hiện thì đa số là giống nhau. Các spider chỉ có thể
đọc được các nội dung text và chúng không thể click vào các button hay sử dụng
các menu. Đó là những giới hạn của chúng.
Một khi các spider nhận được thông tin, chúng sẽ chứa những
thông tin này trong một database, các bộ máy tìm kiếm sẽ sử dụng database này để
quyết định ranking cho website của bạn. Thông tin này là những gì mà người dùng
tìm kiếm khi họ sử dụng các từ khóa để tìm trang web.
Với những khái niệm trên, chắc hẳn rằng bạn muốn website của
mình tối ưu đối với các spider này. Dưới đây là những điều mà bạn có thể làm để
lôi cuốn các spider viếng thăm website của bạn.
Những thứ mà spider mong muốn:
1. File robots.txt
Điều đầu tiên mà các spider sẽ tìm trong
website của bạn là file robots.txt. File này sẽ cho các spider biết trang nào
trong website của bạn mà chúng không cần phải quan tâm. Tất cả các website đều
nên có file này ngay cả nếu đó là website rỗng, bởi vì đây là điều đầu tiên mà
các spider sẽ tìm kiếm. File robots.txt không chỉ để các spider biết được những
thứ chúng không cần phải tìm, mà nó giống như 1 lời mời các spider viếng thăm
website của bạn vậy.
2. Head Section
Khi các spider tìm thấy file robots.txt, chúng
sẽ di chuyển tới phần head section của website. Tại đây chúng sẽ tìm kiếm tiêu
đề, các thẻ meta, và các từ khóa. Bạn nên đảm bảo rằng tiêu đề nên có từ khóa
trong đó và không nên quá dài, khoảng từ 60, 70 kí tự là tốt. Thẻ meta
description sẽ cho các spider biết là website của bạn nói về điều gì. Bạn nên
viết description rõ ràng, súc tích và có chứa keyword trong đó. Đây là những thứ sẽ hiển thị trên các bộ máy
tìm kiếm khi người dùng tìm kiếm. Khi liệt kê các từ khóa, bạn nên đảm bảo rằng
những từ này cũng sẽ có trong nội dung website của bạn. Bạn nên phân tích từ
khóa để tìm ra những từ phù hợp nhất để sử dụng cho chủ đề website.
3. Website content
Tiếp theo các spider sẽ xem xét đến nội dung của website. Bạn
nên viết nội dung cho website có chất lượng, update thường xuyên. Việc bạn
update nội dung thường xuyên sẽ khuyến khích các spider viếng thăm website thường
xuyên hơn.
4. Site Map
Site map của toàn bộ website sẽ giúp cho các
spider dễ dàng di chuyển trong website và index được nhiều trang hơn. Site map
chỉ nên chứa text liên kết đến tất cả các trang.
5. Backlinks
Backlink hoặc các inbound links rất quan trọng bởi
vì chúng nâng cao tầm quan trọng website của bạn trong mắt các spider. Số lượng
các backlink có chất lượng đến site của bạn sẽ được xem như là 1 yếu tố lớn khi
xếp hạng site của bạn. Bạn luôn muốn những backlink từ các website tương tự như
website của bạn và cũng có rank tốt. Nếu bạn tham gia vào việc trao đổi link, bạn
nên cẩn thận chọn những website phù hợp, những link có chất lượng tốt.
Những thứ mà spider không mong muốn:
6. Javascript Navigation
Javascript có thể là 1 ý tưởng tốt để
thiết kế website của bạn, nhưng thật không may là các spider không nhìn thấy
nó. Nếu các link của bạn bị ẩn đối với các spider, chúng sẽ không thể crawl
website và index các trang web của bạn được,do đó sẽ ảnh hưởng đến ranking
trang web của bạn. Để giảm thiểu việc này, hoặc là không sử dụng javascript, hoặc
là thêm các text links trên trang web của bạn.
7. Các trang Doorway
Các trang doorway là các trang web
standalone được nhìn thấy duy nhất bởi các spider. Các trang doorway thường
không có tác dụng và không thích hợp với người dùng. Do đó, các bộ máy tìm kiếm
xem như bạn cố ý làm điều này và có thể sẽ cấm hoặc ban website của bạn.
8. Frames
Người dùng và các spider hầu như sẽ rời khỏi ngay những
website được xây dựng bởi frame. Nó rất khó để di chuyển và cũng rất khó để đọc
đối với các spider và cả người dùng. Các spider có thể sẽ chỉ xác định được mỗi
trang chủ và như vậy sẽ không index đúng được các trang trong website. Có nhiều
vấn đề liên quan tới việc này, tuy nhiên, tốt nhất là không nên sử dụng frame
trong website của bạn.
9. Images
Các hình ảnh rất quan trọng đối với 1 website, tuy
nhiên thật không may là các spider không thể đọc được hình ảnh hoặc là các text
trong hình ảnh. Nếu một website mà không sử dụng hình ảnh thì rất là tệ, tuy
nhiên, khi sử dụng website, bạn nên sử dụng thẻ ALT. Thẻ ALT là một cách để
thêm text vào một hình ảnh để các spider có thể đọc được hình ảnh đó nói về cái
gì.
10. Flash
Flash có thể làm cho website trở nên sinh động, mới lạ
và thu hút người dùng nhưng các spider lại không thể đọc được hay hiểu được nó,
do đó site của bạn sẽ không được index như mong muốn. Sử dụng một vài file
flash trên các trang web thuần html thì ok, nhưng nếu toàn bộ website của bạn
được xây dựng bởi flash thì traffic đến từ các bộ máy tìm kiếm là hầu như không
có.
Tác giả: Mr.Chau243 (Theo SEO News)
Vui lòng ghi rõ nguồn Hỗ trợ SEO - www.hotroseo.com khi phát hành lại bài viết này
Nhận xét
Đăng nhận xét