Mặc dù rất nhiều người đang làm đường dẫn (URL) trở nên thân thiện và chuẩn SEO, nhưng tôi vẫn thấy có rất nhiều SEOer, Coder phạm những sai lầm trong 5 điều tôi sắp đề cập dưới đây.
Trước hết, hãy định hình ra 1 đường dẫn dễ nhớ, đơn giản, đồng nhất và không có thay đổi về sau.
Với 1 người làm SEO, cấu trúc URL của một trang web cần phải:
Với tầm quan trọng của SEO URL đúng cách, bạn sẽ chiếm vị thứ cao trong các bộ máy tìm kiếm. Tuy nhiên, URL không nhất thiết phải như 1 quy luật, đường dẫn nào cũng có cấu trúc giống nhau. Thậm chí, một số bài viết cần loại từ khóa đó ra khỏi URL.
Và đây là những gì cần phải làm để có một đường dẫn (URL) thân thiện và chuẩn SEO:
Mặc định, tên miền của bạn được Index (lập chỉ mục) trong công cụ tìm kiếm dưới 2 tên miền là có www và không có www.
Hầu hết các SEOer (theo kinh nghiệm của tôi) sử dụng chuyển hướng 301 để đưa người dùng đến với 1 dạng tên miền duy nhất.
Cách khác, bạn có thể xác định phiên bản ưa thích của bạn trong Google Webmaster Tools >> Cài đặt >> Preferred Domain. Tuy nhiên, điều này có hạn chế nhất định:
Nhưng tại sao phải lo lắng đến vấn đề dùng www hay không dùng www ở tên miền? Đó là vì, một số backlinks của bạn có thể được trỏ đến tên miền có www của bạn, trong khi một số có thể lại trỏ về tên miền không có www.
Vì vậy, để đảm bảo giá trị SEO không bị chia đôi cho hai phiên bản, tốt nhất là nên chọn một trong hai (dùng cách chuyển hướng 301, hoặc trong Google Webmaster Tools, hoặc bằng cách sử dụng thẻ canonical - tôi sẽ nói đến thẻ này ở phần 5 của bài viết này).
Tùy thuộc vào hệ thống quản lý nội dung của bạn, các URL có thể là "đẹp" như thế này: www.nhatrangdev.com/ten-bai-viet
Hoặc "xấu xí" như thế này: www.nhatrangdev.com/?idbaiviet=578544
Các công cụ tìm kiếm không phân biệt URL xấu hay đẹp, nhưng vì rất nhiều lý do cho nên tốt hơn bạn nên sử dụng đường dẫn URL tĩnh (đẹp), không nên để theo dạng động (xấu). Điều cốt yếu ở đây là đường dẫn thân thiện, có nghĩa là khi người dùng tìm kiếm, họ chỉ cần nhìn vô URL họ sẽ biết ngay 60% nội dung của bài viết.
Bên cạnh đó, Google khuyến cáo sử dụng dấu gạch ngang (-) thay vì dấu gạch dưới (_) trong URL, những từ được nối liền với nhau bằng dấu gạch dưới Google sẽ hiểu đó là một cụm từ dính chùm với nhau, ví dụ như "nha_trang_dev_chao_cac_ban", ta sẽ thu về được kết quả "nhatrangdevchaocacban" ở kết quả tìm kiếm của Google.
Và, để kiểm tra những yếu tố khác của trang của bạn nên có các từ khoá tương tự như các URL của bạn, có một cái nhìn tại các ảnh chụp màn hình 3 của "On-Page SEO cho năm 2013: Tối ưu hóa trang để Đánh giá và Thực hiện" hướng dẫn mà chúng tôi phát hành gần đây.
Bên cạnh đó, hầu hết các Developer (các nhà phát triển website) phát triển web sử dụng các liên kết URL. Vấn đề với URL tương đối (URL động) là nó phụ thuộc vào hoàn cảnh mà chúng xảy ra. Ví dụ người dùng cố tình thay đổi các giá trị, các URL có thể sẽ không hoạt động báo về lỗi 404 hoặc lỗi Database. Làm SEO khôn ngoan sẽ là, sử dụng các URL tuyệt đối thay vì những cái tương đối, các công cụ tìm kiếm rất thích điều này.
Sơ đồ trang web XML khác sơ đồ website HTML. Sitemap XML là dùng cho các Robots tìm kiếm, và sitemap HTML là dành cho người dùng.
Sơ đồ trang web XML là gì? Nói cách đơn giản, đó là một danh sách các URL của trang website bạn gửi đến các công cụ tìm kiếm. Cái này phục vụ cho hai mục đích:
Chọn URL ưu tiên là điều cần thiết, bởi vì đó sẽ là điểm mốc để Robots so sánh các kết quả khác xem có bị trùng lặp không.
Vì vậy, các robots không muốn thấy bất kỳ nội dung bị trùng lặp nào trong kết quả tìm kiếm, công cụ tìm kiếm sử dụng một thuật toán đặc biệt để xác định các trang trùng lặp và chỉ chọn một URL để đại diện cho nhóm trong các kết quả tìm kiếm.
Bây giờ, trở lại bản đồ website ... Một trong những tiêu chí giúp website của bạn được index nhanh là các URL được liệt kê trong Sitemap XML. Đó là con đường tắt để giúp các robots làm việc dễ dàng hơn.
Vì vậy, những gì trang web có đều cần phải đưa vào sitemap XML, nhưng hãy cẩn trọng rằng có phải là tất cả không? Trong thực tế, Sitemap XML chứa tất cả nội dung mà muốn được hiển thị ở kết quả tìm kiếm.
Có thể có các trang trên trang web của bạn nên được giấu kín từ các công cụ tìm kiếm. Đây có thể là trang "Điều khoản", "quy định" và các trang có thông tin nhạy cảm. Tốt nhất là nên chặn hết lại, đừng cho robots tọc tạch ngõ ngách website, rất dễ làm loãng các kết quả tìm kiếm, hoặc bị kẻ xấu lợi dụng.
Các tập tin robotx.txt chứa các câu lệnh hướng dẫn cho các robots tìm những gì mà website cho phép. Các trang này sẽ có một thuộc tính là noindex và không hiển thị trong kết quả tìm kiếm.
Một cách khác để làm nổi bật các URL trên trang web của bạn là sử dụng cái sử dụng thẻ canonical.
Lưu ý: thẻ canonical chỉ được áp dụng với mục đích giúp các công cụ tìm kiếm quyết định ULR ưu tiên của bạn muốn hướng đến.
Ví dụ, trên trang web mua hàng bất kỳ, bạn có thể đi đến trang "Thiết kế website giá rẻ" trực tiếp, hoặc có thể sử dụng từ các đường đi khác nhau ở trang chủ:
Đường dẫn sau sẽ được tạo ra:
Bạn để ý URL trên nó có biến động ở đằng sau, nếu chúng ta không dùng thẻ canonical, giá trị SEO sẽ bị giảm đi nếu chúng ta không nhắm đến từ khóa này.
SEO URL thân thiện là cấu trúc URL đó sẽ giúp cho website của bạn đạt vị thứ cao. Không chỉ vậy, mà nó còn giúp việc phát triển web sau này trở nên an toàn hơn bởi các thuật toán. Hơn nữa là nó là tiêu chí để đánh giá chất lượng website của bạn. Vì vậy, hãy cố gắng thiết kế website chuẩn SEO với đường dẫn thân thiện với người dùng.
Nếu bạn cảm thấy tôi có nói sai hoặc xót, hãy cùng tôi thảo luận dưới đây nhé.