Baru-baru ini, Google mengumumkan bahwa Google Crawl hanya akan mengambil data 15MB HTML pertama dari sebuah website untuk menentukan peringkat SEO sebuah website. Jika sebuah website memiliki ukuran HTML lebih dari 15MB maka sisanya tidak akan berpengaruh pada rangking situs tersebut.
Hal ini sesuai pernyataan yang dapat dibaca dari halaman dokumentasi Google yang telah diperbarui belum lama ini.
Any resources referenced in the HTML such as images, videos, CSS and JavaScript are fetched separately.
Dokumentasi Google
After the first 15 MB of the file, Googlebot stops crawling and only considers the first 15 MB of the file for indexing.
The file size limit is applied on the uncompressed data.
John Mueller memberikan klarifikasi melalui twitter bahwa batasan itu hanya berlaku untuk HTML saja. Sedangkan gambar yang diembed pada halaman tersebut tidak termasuk dalam penghitungan itu. Dengan kata lain gambar atau resource lain yang diembed meskipun ukurannya lebih dari 15MB tidak berpengaruh pada ukuran HTML.
“It’s specific to the HTML file itself, like it’s written,”
John Mueller
“Embedded resources/content pulled in with IMG tags is not a part of the HTML file.”
John Mueller
Lalu apa dampaknya hal ini pada SEO?
Untuk memastikan bahwa konten kita bisa dijangkau oleh Google Bot maka bagian penting harus ditaruh pada bagian menengah ke atas.
Namun perlu diketahui juga bahwa batasan 15MB itu adalah ukuran yang sangat besar untuk halaman sebuah website. Secara umum, ukuran sebuah halaman web atau blog kurang dari 1MB. Jika lebih dari itu maka biasanya akan sangat lambat untuk diakses.
Banyak alat yang bisa digunakan untuk mengetahui ukuran sebuah halaman website. Salah satunya adalah Google Pagespeed Insights.
Batasan 15 MB ini bukanlah algoritma yang baru saja diterapkan oleh Google. Sebetulnya sudah lama diterapkan hanya saja baru dimasukkan kedalam dokumentasi belum lama ini sesuai klarifikasi John Mueller melalui twitter.
“This is not a change, it’s just not previously been officially documented…”
John Mueller