Burp Suite Basics

任务1：运行Burp Suite并连接到目标Web应用程序

在Firefox中，将 Burp 设置为浏览器的代理。

也可以使用扩展FoxyProxy。

在 Firefox 上，您可以按Ctrl + U在新窗口中浏览页面的源代码。

如果您不希望抓取工具访问您网站中的部分内容，可以创建包含相应规则的 robots.txt 文件。robots.txt 文件是一个简单的文本文件，其中包含关于哪些抓取工具可以访问网站的哪些部分的规则。

如果其他网站上有链接指向被 robots.txt 文件屏蔽的网页，则此网页仍可能会被编入索引。若要阻止你的网址出现在搜索结果中，你应该为服务器上的文件设置设置密码保护、使用“noindex”阻止搜索引擎编入索引。

和其他网址一样，robots.txt 文件的网址也区分大小写。

robots.txt 文件必须是采用 UTF-8 编码的纯文本文件，且各行代码必须以 CR、CR/LF 或 LF 分隔。可以使用Notepad、TextEdit、vi 和 emacs 可用来创建有效的 robots.txt 文件。请勿使用文字处理软件。

#字符：注释，后面的所有内容都会被忽略。

user-agent：标识规则适用的抓取工具。

allow：可抓取的网址路径。

disallow：不可抓取的网址路径。

allow 和 disallow 字段也称为”指令”。默认情况下，指定的抓取工具没有抓取限制。

如果指定了 [path] 值，该路径值就是 robots.txt 文件所在网站的根目录的相对路径（使用相同的协议、端口号、主机和域名）。路径值必须以 / 开头来表示根目录，该值区分大小写。

Google 会以 allow 和 disallow 指令中的路径值为基础，确定某项规则是否适用于网站上的特定网址。为此，系统会将相应规则与抓取工具尝试抓取的网址的路径部分进行比较。

对于路径值，Google、Bing 和其他主流搜索引擎支持有限形式的通配符。这些通配符包括：

路径匹配示例
/	匹配根目录以及任何下级网址。
/*	等同于 `/`。结尾的通配符会被忽略。
/$	仅匹配根目录。任何更低级别的网址均可抓取。
/fish	匹配以 /fish 开头的任何路径。匹配项： /fish /fish.html /fish/salmon.html /fishheads /fishheads/yummy.html /fish.php?id=anything 不匹配项： /Fish.asp /catfish /?id=fish /desert/fish 注意：匹配时区分大小写。
/fish*	等同于 /fish。结尾的通配符会被忽略。匹配项： /fish /fish.html /fish/salmon.html /fishheads /fishheads/yummy.html /fish.php?id=anything 不匹配项： /Fish.asp /catfish /?id=fish
/fish/	匹配 /fish/ 文件夹中的任何内容。匹配项： /fish/ /animals/fish/ /fish/?id=anything /fish/salmon.htm 不匹配项： /fish /fish.html /Fish/Salmon.asp
/*.php	匹配包含 .php 的任何路径。匹配项： /index.php /filename.php /folder/filename.php /folder/filename.php?parameters /folder/any.php.file.html /filename.php/ 不匹配项： /（即使其映射到 /index.php） /windows.PHP
/*.php$	匹配以 .php 结尾的任何路径。匹配项： /filename.php /folder/filename.php 不匹配项： /filename.php?parameters /filename.php/ /filename.php5 /windows.PHP
/fish*.php	匹配包含 /fish 和 .php（按此顺序）的任何路径。匹配项： /fish.php /fishheads/catfish.php?parameters 不匹配项： /Fish.PHP