Google có chính sách không khoan nhượng đối với những trang nào có nội dung trùng lặp (duplicate content).
Cụ thể như sau:
Hạn chế organic traffic: Google sẽ hạ xếp hạng hoặc không index những bài viết có nội dung trùng lặp.
Phạt nặng (hiếm xảy ra): từ chối index toàn bộ trang web. Tuy nhiên điều này chỉ xảy ra khi bạn cố tình copy toàn bộ trang khác một cách tuyệt đối.
Vậy nội dung trùng lặp là gì, làm sao để phát hiện và loại bỏ chúng?
Đó sẽ là nội dung của bài viết hôm nay!
1. Nội dung trùng lặp là gì?
Khi nội dung có sự tương đồng hoặc giống nhau tuyệt đối thì đó gọi là nội dung trùng lặp. Điều này có thể xảy ra giữa các web khác nhau, hoặc từ các trang khác nhau trên cùng một website.
Thông thường, không ít người nghĩ rằng nội dung trùng lặp là phải giống nhau tuyệt đối.
Sự thật không đơn giản như vậy.
Hãy xem ví dụ ở dưới:
Ở đây, nếu bạn thay từ “dog” bằng từ “canine”, và từ “jumped” bằng từ “leaped”, vốn đều là từ đồng nghĩa trong tiếng Anh, thì đây vẫn được xem là nội dung trùng lặp.
2. Nguyên nhân chính dẫn đến nội dung trùng lặp
Các nguyên nhân phổ biến nhất bao gồm:
- Lỗi trong hệ thống quản lý nội dung (CMS). Khi vận hành sai, hệ thống có thể tạo ra nhiều URL cho một bài viết.
- Chuyển hướng 301 không được thiết lập sau khi chuyển từ http sang https.
- Cài đặt không chính xác và tạo link tự động trong quá trình vận hành trang web.
- Thêm tham số “get” và “utm” vào URL.
- Nhân tố con người: quản trị viên của có thể “vô tình” sao chép trang.
- Khi trang web có địa chỉ mới nhưng quên xóa địa chỉ cũ.
3. Cách phát hiện nội dung trùng lặp
Có rất nhiều cách để làm điều này, trong đó phổ biến nhất là Google Search Console.
Tuy nhiên, nếu bạn cũng giống tôi, muốn chọn một cách nào đó đơn giản đỡ suy nghĩ nhất, thì Netpeak Spider hoàn toàn đáp ứng tốt điều này.
Bạn có thể tham khảo chi tiết về công cụ này tại đây.
Bước 1: Khởi động Netpeak Spider.
Bước 2: Đến phần 'Advanced' của menu 'Settings' và đảm bảo các ô như trong hình đã được đánh dấu.
Bước 3: Nhấp vào 'OK' để lưu cài đặt.
Bước 4: Nhập URL trang web vào thanh địa chỉ và nhấp ‘Start’ để bắt đầu thu thập thông tin.
Khi quá trình thu thập thông tin hoàn tất, các vấn đề sẽ xuất hiện ở góc phải như trong hình (trùng H1, tên tiêu đề, nội dung …)
4. Cách xử lý nội dung trùng lặp
Để loại bỏ nội dung trùng lặp trên một trang web, bạn có thể sử dụng một số các phương pháp sau:
Điều hướng về địa chỉ chính thức
Điều này xảy ra khi phiên bản “WWW” của trang web không chuyển hướng phiên bản “không có WWW”, hoặc ngược lại.
Hoặc khi bạn chuyển trang web của mình sang "HTTPS"… mà quên không đổi "HTTP".
Tóm lại: tất cả các phiên bản khác nhau của trang web của bạn phải được điều hướng về cùng một nơi.
Chuyển hướng 301.
Nếu bạn thấy nhiều trang có nội dung trùng lặp, hãy chuyển hướng chúng về lại trang gốc.
Điều này giúp khi Googlebot ghé qua, nó sẽ chỉ index mỗi trang gốc đó.
Thuộc tính rel=”canonical”.
Thẻ rel=canonical sẽ ra hiệu cho cho công cụ tìm kiếm hiểu rằng:
“Chúng tôi có rất nhiều trang có nội dung trùng lặp. Nhưng trang này mới là bản chính. Đừng quan tâm đến các trang còn lại”.
Hơn nữa, Google cũng nhấn mạnh rằng dùng thẻ canonical tốt hơn là khóa các trang có nội dung trùng lặp.
Một ví dụ điển hình của việc khóa này là chặn Googlebot bằng robots.txt hoặc bằng thẻ noindex trong HTML.
Viết nội dung unique (nguyên bản không phải copy)
Đầu tiên, hãy viết lại những phần tiêu đề, mô tả ... bị trùng lặp đã có ở trên trang (nếu có).
Và để tránh lặp lại vấn đề này cho các bài viết về sau, bạn cần phải cố gắng “động não” mỗi khi viết nội dung cho từng URL.
Nếu gặp khó khăn, hãy tham khảo nội dung ở các trang web khác để luôn có ý tưởng mới.
Tuy nhiên, nhớ là tham khảo thôi chứ đừng copy hoàn toàn nhé.
5. Kết luận
Nội dung trùng lặp luôn là tác nhân hàng đầu ngăn bạn thăng hạng trên SERP.
Vì thế, điều cần làm là kiểm tra trang web thường xuyên, tốt nhất là 1-3 tháng một lần để phát hiện và loại bỏ chúng.
Các cách xử lý nội dung trùng lặp đơn giản bao gồm:
- Điều hướng về địa chỉ chính thức
- Chuyển hướng 301
- Thuộc tính rel=canonical
- Viết nội dung unique
Món quà dành tặng riêng cho tất cả độc giả của VOH!!!
VOH xin tặng bạn một ưu đãi độc quyền giảm giá 15% cho tất cả sản phẩm của Netpeak. Chỉ cần sử dụng mã giảm giá voh15 trong quá trình mua hàng, bạn sẽ tận hưởng mức giảm giá đáng kể để khám phá những tính năng ưu việt của công cụ SEO xuất sắc này.