[blog seo] - Sitemap là một
danh sách các trang của một trang web được thiết kế dành cho trình thu thập dữ
liệu hoặc người sử dụng . Nó có thể là một tài liệu dưới hình thức bất kỳ được
sử dụng như một công cụ lập kế hoạch thiết kế web, hoặc là một page liệt kê các
trang trên một trang web, thường tổ chức theo thứ tự thời gian. Sitemap Điều
này giúp du khách và công cụ tìm kiếm dễ dàng tìm thấy các trang trên trang
web.“Bản đồ trang”, là thể các tổng quan về hệ thống website của bạn. Sitemap
hường được lưu trữ dưới định dạng XML, hoặc HTML trên website.
Sitemap là
cách dễ dàng khi webmaster muốn thông báo cho công cụ tìm kiếm về các trang
trên trang web của họ. Hình thức đơn giản nhất của Sitemap là một tập tin XML
liệt kê các URL của một trang web cùng với siêu dữ liệu bổ sung về mỗi URL (thời
điểm được cập nhật lần cuối, mức độ thường xuyên thay đổi, mức độ quan trọng
như thế nào, so với các URL khác trong trang web) để các công cụ tìm kiếm có
thể thu thập dữ liệu trang web một cách thông minh hơn.
Các trình thu
thập Web thường khám phá các trang từ các liên kết trong trang web (Internal
link) và từ các trang web khác (backlink). Sitemap bổ sung dữ liệu này để
cho phép trình thu thập dữ liệu của công cụ tìm kiếm tìm hiểu kỹ hơn về những
URL với các siêu dữ liệu liên quan. Sử dụng Sitemap không đảm bảo rằng các
trang web được index, nhưng là cách dễ nhất cung cấp gợi ý cho trình thu thập
web để công cụ tìm kiếm làm việc tốt hơn khi thu thập dữ liệu trang web của bạn.
Có hai loại sitemap:
HTML sitemap
- HTML sitemap liệt kê tất cả các liên kết URL trong từng phần hay từng trang
khác nhau của Blog hay Website.
- URL
được liệt kê sắp xếp theo thứ tự thư mục và hiển thị theo tiêu đề trang.
- HTML sitemap giúp người dùng di chuyển và tìm được thông tin dễ dàng.
XML sitemap
- XML sitemap hiển thị danh sách các URLs của blog hay Website theo chuẩn đặc biệt
XML. Tham khảo ( Sitemap trên wikipedia ).
- URL
được liệt kê theo thứ tự ưu tiên tùy vào tiêu chí của Webmaster.
- XML sitemap cho phép Webmaster thông báo tới Google về các URLs trên blog hay
Website nhằm tạo thuận lợi cho quá trình index.
Tại sao bạn nên dùng Sitemap?
Nếu trang web
của bạn rơi vào một trong những trường hợp sau thì Sitemap sẽ rất có ích cho
trang web của bạn
- Trang web của
bạn là web động
- Trang web của
bạn sử dụng AJAX hoặc Flash làm cho robot tìm kiếm của Google khó tìm thấy được
- Trang web của
bạn vừa được phát triển và ít có liên kết đến. Bởi vì Googlebot crawl web bằng
cách đi theo các đường link liên kết từ trang này qua trang khác, cho nên nếu
trang web của bạn không được link đến nhiều, sẽ rất khó cho Googlebot tìm được
trang của bạn.
- Trang web của
bạn có nhiều trang nội dung khác nhau nhưng không được liên kết với nhau hoặc
liên kết giữa chúng không nhiều.
Bên cạnh đó,
Sitemap có thể giúp Google biết được những thông tin khác về trang web của bạn
như:
- Nội dung của
bạn được cập nhật thường xuyên hay không.
Ví dụ: "bạn có
thể post bài thường xuyên trong blog của bạn, nhưng những trang như Liên Hệ ít
được cập nhật hơn."
- Ngày chỉnh sửa
nội dung cuối cùng của trang.
- Bạn có thể
thiết lập tầm quan trọng của từng trang khác nhau.
Ví dụ: "Trang
Chủ sẽ có tầm quan trọng là 1.0 điểm, trang con nằm trong trang chủ như
Categories được 0.8 điểm, và các bài post được 0.5 điểm. Thang điểm này chỉ có
tác dụng chỉ ra tầm quan trọng của một địa chỉ URL cụ thể so với những địa chỉ
URL khác trong trang của bạn, nó không ảnh hưởng đến PageRank của trang trong kết
quả tìm kiếm của Google".
Cách tạo sitemap
Google có thể
chấp nhận Sitemap trong một số định dạng, nhưng tôi khuyên bạn nên tạo một
Sitemap dựa trên giao thức Sitemap bởi vì cùng một định dạng có thể được hầu hết
các công cụ tìm kiếm khác như Bing và Yahoo chấp nhận (Những công cụ là thành
viên của sitemaps.org).
Ví dụ về
Sitemap cơ bản với một mục duy nhất cho một URL bao gồm hình ảnh và video:
<?xml version=”1.0″ encoding=”UTF-8″?><urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1" xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1"> <url> <loc>http://www.example.com/foo.html</loc> <image:image> <image:loc>http://example.com/image.jpg</image:loc> </image:image> <video:video> <video:content_loc>http://www.example.com/video123.flv</video:content_loc> <video:player_loc allow_embed="yes" autoplay="ap=1">http://www.example.com/videoplayer.swf?video=123</video:player_loc> <video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc> <video:title>Grilling steaks for summer</video:title> <video:description>Get perfectly done steaks every time</video:description> </video:video> </url></urlset>
Bạn có thể tạo
Sitemap của bạn bằng tay hoặc công cụ của bên thứ ba. Ngoài định dạng tiêu chuẩn
nêu trên, Google cũng chấp nhận một số định dạng sau:
RSS, mRSS và
Atom 1.0 : Google chấp nhận RSS (Real Simple Syndication) 2.0 và Atom 1.0 nguồn
cấp dữ liệu . Nếu bạn có một blog với một nguồn cấp dữ liệu RSS hoặc Atom, bạn
gửi URL của nguồn cấp dữ liệu như một Sitemap. Hầu hết Blog đều có nguồn cấp dữ
liệu. Lưu ý rằng nguồn cấp dữ liệu chỉ có thể cung cấp thông tin trên các URL gần
đây. Ngoài ra, bạn có thể sử dụng một mRSS (phương tiện truyền thông RSS) Feed
để cung cấp cho Google với các chi tiết về nội dung video trên trang web của bạn.
Tập tin văn bản
: Sitemap cơ bản (Sitemap bao gồm chỉ URL trang web, chứ không phải hình ảnh,
video, hoặc các dữ liệu specalized khác), bạn có thể cung cấp cho Google với một
tập tin văn bản đơn giản có chứa một URL trên mỗi dòng.
Để tạo Sitemap bằng công cụ của bên thứ
3 (theo giới thiệu của Google) bạn follow link sau:
Công cụ miễn
phí mà tôi hay dùng là http://www.xml-sitemaps.com/
Một số chú ý
khi tạo sitemap
- Một tập tin Sitemap không thể chứa hơn 50.000 URLs và không được lớn hơn 50MB khi được giải nén. Nếu Sơ đồ trang web của bạn lớn cỡ này, chia nó thành các file sitemap nhỏ hơn. Các giới hạn này đảm bảo cho máy chủ web của bạn không bị quá tải phục vụ các tập tin lớn cho Google.
- Nếu bạn có nhiều hơn một Sơ đồ trang web, bạn có thể liệt kê chúng trong một tập tin chỉ mục sitemap.
- Nếu URL mặc định của website là http://www.seochuyennghiep.vn thì URL trong sitemap cũng phải có định dạng như vậy.
- URL trong sitemap không được chứa ID
- Sitemap của bạn phải xác định không gian tên XML sau : xmlns = "http://www.sitemaps.org/schemas/sitemap/0.9" .
- URL Sitemap phải được mã hóa UTF8 , và mã hóa cho dễ đọc với các máy chủ web.
- Nếu trang web của bạn có thể truy cập trên cả hai phiên bản www và không www của tên miền của bạn, bạn không cần phải gửi Sitemap riêng biệt cho mỗi phiên bản.
- Mỗi Sitepmap độc lập với mỗi ngôn ngữ của nội dung. Hãy đảm bảo rằng mỗi phiên bản ngôn ngữ có thể được thu thập dữ liệu và lập chỉ mục, sử dụng các URL duy nhất. URL này có thể được bao gồm trong các Sitemap
- Nếu bạn dùng wordpress thì đơn giản là sử dụng Plugin Google XML Sitemaps
Kết luận:
Sitemap cung cấp thêm thông tin cần
thiết về trang web của bạn và cho Google mà phương pháp crawl thông thường của
Google có thể bỏ sót. Tạo XML Sitemap không hề mất thời gian, khai báo với
Google cũng rất đơn giản. Nhưng hiệu quả mà nó mang lại cho trang web của bạn
cũng rất lớn. Bất cứ thứ gì có lợi cho trang web của bạn, bạn cũng nên áp dụng
cho mình.
Bonus: submit sitemap lên google webmaster tool:
submit sitemap lên google webmaster tool |
Vui lòng ghi rõ nguồn khi trích dẫn bài này