“robots.txt”文件包含一條或多條記錄,這些記錄通過空行分開(以CR、CR/NL、or NL作為結(jié)束符),每一條記錄的格式如下所示:
“<field>:<optionalspace><value><optionalspace>”
在該文件中可以使用#進(jìn)行注釋,具體使用方法和UNIX中的慣例一樣。該文件中的記錄通常以一行或多行User-agent開始,后面加上若干Disallow行,詳細(xì)情況如下:
User-agent:
該項的值用于描述搜索引擎機(jī)器人robot的名字。在“robots.txt”文件中,如果有多條 User-agent記錄,說明有多個robot會受到該協(xié)議的約束。所以,“robots.txt”文件中至少要有一條User- agent記錄。如果該項的值設(shè)為*(通配符),則該協(xié)議對任何搜索引擎機(jī)器人均有效。在“robots.txt”文件 中,“User-agent:*”這樣的記錄只能有一條。
Disallow:
該項的值用于描述不希望被訪問到的一個URL,這個URL可以是一條完整的路徑,也可以 是部分的,任何以Disallow開頭的URL均不會被robot訪問到。例如:
“Disallow: /help”對/help.html 和/help/index.html都不允許搜索引擎訪問, 而“Disallow: /help/”則允許robot訪問/help.html,而不能訪問/help/index.html。
任何一條Disallow記錄為空,說明該網(wǎng)站的所有部分都允許被訪問,在 “/robots.txt”文件中,至少要有一條Disallow記錄。如果“/robots.txt”是一個空文 件,則對于所有的搜索引擎robot,該網(wǎng)站都是開放的。
來源:seo優(yōu)化網(wǎng) 轉(zhuǎn)載注明出處!
新聞熱點
疑難解答
圖片精選