Google Pagerank

Google Pagerank là gì

Google Pagerank là gì, Ứng dụng của mô hình Markov trong thuật toán Google PageRank như thế nào? Nếu bạn là người mới bước chân vào công việc tối ưu tìm kiếm thì đây chính là kiến thức mà bạn chắc chắn phải biết.

Google Pagerank
Google Pagerank

Google Pagerank là gì

Pagerank (PR): là thước đo của Google về mức độ nổi tiếng (phổ biến) của một trang web, dựa trên số lượng và chất lượng của các backlink trỏ đến. Đây là tên của một thuật toán phân tích liên kết được đặt theo tên của Larry Page, một trong hai người sáng lập Google.

Hiện nay Google không còn sử dụng Pagerank như là yếu tố quan trọng để xếp hạng các trang web. Pagerank tính trên từng trang, có giá trị từ 0 – 10, được Google cập nhật 3 tháng 1 lần hoặc có thể lâu hơn.

Trong đó PR N/A (chưa có PR) là trang web mới, không phổ biến. Pagerank càng lớn thì thứ hạng trang web càng cao, giá trị của liên kết ra sẽ càng lớn.

Một trang web có chỉ số Pagerank cao sẽ đem lại ấn tượng, và sự tin cậy cho khách truy cập, điều này đặc biệt có ý nghĩa với các website kinh doanh thương mại điện tử. Pagerank được Google lưu trữ trên máy chủ cùng với thông tin khác của trang web.

Ứng dụng của mô hình Markov trong thuật toán Google PageRank như thế nào?

Thuật toán PageRank

Thuật toán PageRank là một thuật toán học xếp hạng dựa trên phân tích đồ thị liên kết giữa các trang web, mỗi trang web sẽ được xem như một đỉnh, mỗi liên kết sẽ được xem như một cạnh của đồ thị.

Thuật toán PageRank chỉnh sửa nho nhỏ lại ý tưởng ban đầu, bằng cách thêm một tham số d (được gọi là Damping Factor) để “làm mềm” lại bài toán ban đầu:

thuat toan pagerank

Với 0<d<1, Google sử dụng d=0,85. Nếu viết lại dưới dạng ma trận chúng ta có thể phát biểu thuật toán PageRank như sau:

thuat toan pagerank la gi

Mô hình mới có thể diễn giải như sau, những người lướt web ngẫu nhiên trên những liên kết ban đầu, tuy nhiên một lúc sau thì họ cảm giác “chán với những trang web hao hao nhau” và đột ngột nhảy sang khác không liên quan gì đến liên kết đầu cả.

Nếu bạn chú ý kỹ sẽ thấy những trường hợp như đồ thị không liên thông hay tồn tại những đỉnh đu đưa là trường hợp đặc biệt của ma trận có chứa phần tử . Việc thêm ma trận vào nhằm giải quyết vấn đề có phân bố dừng hay không.

Hợp lí không? Hợp lí chứ! Và tất nhiên sẽ còn hợp lí hơn nữa vì định lý Perron Frobenius cho chúng ta biết rằng để giải được bài toán này, điều cần thiết đầu tiên là phải “làm mất mấy số  trong ma trận ban đầu đi”, việc thêm ma trận  với hệ số  tác dụng cốt lõi là làm việc này!

Xích Markov là một mô hình toán học mô tả quá trình chuyển dịch từ một trạng thái sang một trạng thái khác dựa trên một số quy luật xác suất nhất định. Trong một quá trình như vậy, xích Markov không quan tâm đến thông tin quá trình bằng cách nào ta chuyển dịch đến trạng thái hiện tại, xác suất của trạng thái tiếp theo phụ thuộc vào trạng thái hiện tại và thông tin xác suất đang có tại thời điểm .

Nếu giả định rằng biến ngẫu nhiên trạng thái quan sát được là biến ngẫu nhiên rời rạc, hay  trạng thái, lúc này mô hình của chúng ta là xích Markov hữu hạn trạng thái (finite-state Markov chain). Xác suất có điều kiện chuyển dịch khi biết trạng thái hiện tại  có thể viết lại dưới dạng ma trận , được gọi là ma trận chuyển dịch , với  là xác suất chuyển dịch từ trạng thái i sang trạng thái . Mỗi hàng của ma trận  có tổng , vì vậy ma trận này được gọi là ma trận ngẫu nhiên (stochastic matrix).

Khi mà ma trận chuyển dịch độc lập với thời gian, nghĩa là quá khứ, hiện tại, tương lai chúng ta chỉ có duy nhất một ma trận chuyển dịch thôi hay nói cách khác  chúng ta gọi đây là một xích Markov đồng nhất thời gian (time-homogeneous Markov chains).

Bạn có thể tưởng tượng một xích Markov hữu hạn đồng nhất thời gian như một cỗ máy đặc biệt vậy, hãy tưởng tượng về một hệ động lực ngẫu nhiên… Hãy tưởng tượng mỗi quả banh sẽ thay đổi trạng thái trong hệ thông qua những chiếc máy bơm ngẫu nhiên… Tại mỗi thời điểm  sang  máy bơm sẽ bắn các quả banh theo những đường ống với xác suất nhất định.

Kiểm tra PageRank của một trang web?

Bạn có thể dụng công cụ Seoquake ( Một tiện ích hỗ trợ Seo rất tốt mà Fame Media đã từng nói đến ).

Hầu hết những người làm SEO không bao giờ nghĩ về Xếp hạng trang của Google vì những lý do rõ ràng: nó đã cũ và không có cách nào để xem Xếp hạng trang cho một trang nữa, ngay cả khi bạn muốn.

Nhưng điều quan trọng cần nhớ là công thức Xếp hạng trang là trọng tâm của nhiều phương pháp SEO tốt nhất hiện nay. Đó là lý do tại sao các liên kết ngược lại quan trọng và đó là lý do tại sao các chuyên gia SEO vẫn chú ý nhiều đến liên kết nội bộ.

Điều đó không có nghĩa là bạn nên ám ảnh hoặc thậm chí cố gắng tối ưu hóa trực tiếp cho Xếp hạng trang. Bạn không nên. Nhưng hãy hiểu rằng bất cứ khi nào bạn xây dựng liên kết, hãy làm việc trên cấu trúc liên kết nội bộ hoặc kiểm tra các liên kết bên ngoài của bạn. Những gì bạn thực sự đang làm là gián tiếp tối ưu hóa PageRank.

error: Content is protected !!