XSS 利用的是用户对网站的信任，CSRF 利用的是网站对用户的信任。

XSS

跨站脚本攻击(Cross Site Scripting)其简称应该是 CSS，但是 CSS 与前端的样式表重叠了，所以改为 XSS，这个 X 其实是 Cross 的通用英文缩写
。XSS 攻击的原理是数据变成了脚本，常用的探测方法就是<script>alert(1)</script>这一条如果能注入成功就能以 src 的方式注入外部脚本。

危害

在常用的探测脚本中都是alert(1)，弹个框能有啥用，还能上天不？答案是真的能上天：

获取页面数据（你看到的东西别人也能看到,偷取网站数据）
获取 Cookies（敏感信息泄露，例如登录态）
劫持前端逻辑（欺骗用户，本来应该做 A 操作的，结果点击按钮执行了 B）
发送请求

因此 XSS 是比较危险的。

防御措施

概括起来就是以下几种：

转义
节点白名单，仅仅保留白名单中的节点
CSP(Content Security Policy) 限制脚本加载来源
现代浏览器自带拦截，X-XSS-Protection头，可以防止反射型XSS,防止URL中的参数再次出现在HTML内容和属性中，防御非常有限
对输入HTML内容进行转义，将<,>,",'转义为HTML实体即可,参见escape-html的npm模块，其实比较好的方法是对输入的内容进行JSON序列化，js中对应的就是JSON.stringify
对于富文本中XSS攻击的防御比较推荐的做法是按照白名单保留部分标签和属性，因为黑名单实在是太多了（各种script标签，onerror,onmouseover,onclick,每当你增加一个新的黑名单规则很容易找到一个方案绕过!白名单的思想是解析HTML文本构造成文档树(cheerio)，仅仅保留白名单中指定的那些类型的节点，如下所示：

function xssFilter(html) {
    const cheerio = require('cheerio');
    const $ = cheerio.load(html);
    const whiteList = {
        'img': ['src'], // img标签只能有src属性
        'font': ['color', 'size'], // font标签只能有color和size
        'a': ['href']
    };
    $('*').each((index, element) => {
        const elementName = element.name;
        if (!whiteList[elementName]) {
            $(element).remove();
            return;
        }
        for (const attr in element.attribs) {
            if (!whiteList[elementName].includes(attr)) {
                $(element).attr(attr, null);
            }
        }
    });
    return $.html();
}

成熟方案js-xss,这个模块采用的就是白名单的思想。

CSP即内容安全策略，这个规范与内容安全有关，主要是用来定义页面可以加载哪些资源，减少 XSS 的发生。XSS 之所以是漏洞的原因是“内容被当成了程序”执行了，这样我们只需要将用户输入的内容标记为不可执行，那么注入的内容也不会产生实际的危害。需要服务器设置Content-Security-Policy响应头。

CSRF

跨站请求伪造，注意和 XSS 中的跨站不同，这个主要是在其他任意网站进行的操作对目标网站造成了影响。一个可怕的例子是：打开了一个别人发给你的网站，你的钱莫名其妙变少了，csrf 也被称为one click attack，一点就爆炸。

原理是攻击者获取了用户的登陆凭证仿冒了用户（最常用的攻击方式是携带了cookie）。这种攻击可怕的方式在于被攻击用户是毫不知情的。因此可以用来盗取用户资金，冒充用户进行发帖（灌水的时候可以加上攻击者的网址链接，用户一点就由发起了CSRF攻击，从而造成 CSRF 蠕虫，影响非常恶劣，例如微博这种 UGC 平台）

攻击者通过一些技术手段欺骗用户去访问一个自己以前认证过的网站并执行一些操作（发邮件，发消息，购买商品，转账等）。因为浏览器之前认证过，被访问的网站会觉得这是真实用户操作。

防御措施

Get 请求应该具有幂等性，不能对数据进行修改
限制 Cookie 在跨站请求中的发送，cookie的samesite属性，这种方式防止 CSRF 非常简单，但是有浏览器兼容性问题。
CSRF 是绕过了网站的前端直接发送带有 cookie 信息的请求，因此可以在网站前端加入只有前端才能得到的信息。基于这个思想有 2 种解决方案：验证码和 csrf_token。都能很大程度避免 CSRF，但是验证码对体验其实是有降低的，csrf_token 的原理是后端生成随机字符串放到 session 和前端表单的隐藏域中（不需要实际显示），表单提交的时候校验 session 中的 token 和表单提交的 token 是否一致。注意：不管是验证码和 csrf_token 都需要做空值验证（注意逻辑陷阱，攻击者可能发送空值绕过验证），在 ajax 请求中token 通常放置在 meta 标签中。
验证 Refer，禁止来自第三方网站的请求，注意 refer 是一个完整的 url，验证的时候需要保证鲁棒性，例如:http://www.b.com&c=www.a.com，是一个合法 refer，如果 a.com仅仅用indexOf(“www.a.com")进行验证可能有安全问题。
增加验证流程，例如指纹、密码、短信验证码

Cookie 遵循同源策略，只有同源才可以读写。HTTP only 的 Cookie 对于js是不可见的，path 和 domain 也可以控制 Cookie 的可见性。

Cookie 常用来保存用户的登陆凭证，因此直接将 uid 放在 Cookie 中有巨大的安全隐患（别人可以篡改 Cookie 模仿任意用户），常见的做法是 uid+签名。大致流程如下：

const KEY = 'HSD#$#%$6575FDGKJFl';

const crypto = require('crypto');

function signUid(uid) {
    const hmac = crypto.createHmac('sha256', KEY);
    hmac.update(String(uid));
    return hmac.digest('hex');
}

/**
 * @param {*} uid cookie中的uid
 * @param {*} sign cookie中的签名
 */
function checkAuth(uid, sign) {
    const expectedSign = signUid(uid);
    return expectedSign === sign;
}

let uid = 1;
let sign = signUid(uid);
// 登陆成功后向cookie中设置uid和uid签名
console.log('uid = ', uid, 'sign = ', sign);

// 当用户进行其他需要授权的操作的时候验证传入的uid和签名
console.log('合法用户，验证结果', checkAuth(uid, sign));
uid = 2;
console.log('篡改cookie中的uid为2，验证结果', checkAuth(uid, sign));
uid = 1;
sign = 'modifyed sign';
console.log('篡改cookie中的签名，验证结果', checkAuth(uid, sign));

除了上述 uid+uid签名的方式，还有没有不暴露用户信息的方式呢？

答案是有的，将 uid 以密文的设置到 Cookie，服务器每次对 Cookie中的 uid 进行解密。

另外还有一种基于 session 的方案，校验用户名和密码之后服务器生成一个键值对，其中key 为 sessionid（随机字符串），value 为用户信息，服务器可以将此信息持久化到外部存储，并将 sessionid 放入客户端 cookie 中，客户端每次请求的时候带上 cookie，这样服务器就知道当前用户了，这样就可以避免暴露 uid。

XSS与cookie的关系

XSS 可能盗取用户 cookie，设置 http only 的 cookie 不会被盗取(因为无法被 js 访问)

CSRF和cookie的关系

csrf则是利用了用户cookie，验证码和csrf token方式有效的原因是无法修改目标网站的cookie，最好是禁用第三方的cookie。

如果没有cookie，csrf和xss的攻击威力至少少一大半。

点击劫持

一个典型的场景是将目标网站（恶意网站）放入到 iframe 中，并将此 iframe 的透明度设置为 0，导致用户实际上是看不到目标网站的。接下来使用一张比较劲爆的背景图吸引用户对用户进行指导按照指定的位置进行点击，这样用户实际上是在和目标网站进行交互。

解决方案是服务器输出 header:X-Frame-Options 禁止内嵌。例如支付宝进行这样处理的：

<body>
    <h1>sdfds</h1>
    <img src="" alt="">
    <iframe src="http://www.alipay.com" frameborder="0"></iframe>
</body>

当我们试图在自己的网页中内嵌支付宝的时候显示如下：

值得注意的是这个 HTTP 头兼容性非常好（从IE8）

传输安全

http 中的 connect 方法是实现 http 代理的一种方法，它实际上是一种 TCP 代理，因此也可以代理 HTTPS ，但是 HTTPS 中的内容是密文无法查看。免费的 HTTPS 常用let’s encrypt

密码安全

足够复杂的密码是对抗彩虹表的有效手段之一，因为彩虹表受限于计算和存储性能。密码的变换次数越多越安全，加密成本几乎不变（生成密码的时候速度慢一些），彩虹表失效（数量太大，无法建立通用性），解密成本增大 N 倍。

保证密码传输安全主要有以下几种手段：

https传输
登陆频率限制（一定程度上杜绝暴力破解）
前端加密意义是有限的（因为前端传的是明文中间人就传明文，前端传的密文中间人就传密文，但是中间人至少无法知道明文密码）

接入层注入问题

SQL 注入和 XSS 非常类似：都是数据变成了程序被以外执行。

末尾的1=0使得所有条件为假，不会得到任何数据
末尾的1=1使得所有条件为真，查出所有数据
可以用于服务器数据库版本探测，比如如果某个版本有漏洞可能被利用
针对每一条记录都返回 1，2，3
在 4 的基础上多了最前面的id列
union 可以将结果展示到结果的下方，可以用于探测表有多少个字段（1，2如果不报错则表示有 2 个字段；1，2，3 不报错就表示有3个字段）
可以对表数据进行探测

SQL 注入有非常多的写法，防不胜防，后果非常严重，一定要引起足够重视！其实SQL注入并不是小公司才有，支付宝、腾讯、微博这种体量的公司也曾经出现过这个问题。

SQL注入的防御

关闭错误输出：错误信息对于攻击者有非常大的帮助，黑客可以根据报错决定注入方向是否正确或者向哪个方向改进
检查参数类型：例如输入的 id 只能是整数，不能拼接其他字符串
对数据进行转义：例如node-mysql包中可以对参数进行转义mysql.escape(param),在使用占位符?的时候会自动调用escape
参数化查询：查询步骤分2步：①将带参数的SQL发给服务器，但是并不真正执行，因为没有真正的参数，这个时候 SQL 服务器知道了你的意图。②只发送参数。这种方式在 Java 中叫做PreparedStatement，node-mysql2支持这种方式。使用参数化查询之后用户无法改变SQL语句的意图，最简单最彻底的防御
使用 ORM，安全性好，开发效率也高

NoSQL的注入和防御

可以看到在 POST 模拟的时候不知道用户名和密码的情况下就得到了 token，即成功登陆。后端登陆的伪码如下：

主要问题在于 password 传的不是字符串而是对象，同样的原理我们可以在不知道 username 的情况下进行相同的注入。

防御方法：

入参数据检查和转换
写完整条件

接入层上传问题

上传业务通常分为 2 步

上传文件
再次访问上传的文件

一般而言上传是不会有问题的，但是当上传的文件被当做程序来解析执行（例如：服务器是 php，上传的是 php 文件）就有严重问题了。

解决方案有：

限制后缀名，例如后端是 php 的话不能上传 php 文件，有的时候非常简单有效，但是不一定准确
检查文件类型，这个依赖浏览器的 MIME，攻击者可能绕过浏览器
文件内容检查，不同类型的文件有不同的内容头，即开头的几个字符都是有一定特征的
程序输出：不要让用户上传的文件被直接访问。即上传文件的目的就是为了显示，可以程序读取文件内容给到前端，但是会降低性能，一个折中的方法是有读文件请求的时候给 NGINX 发一个指令
权限控制：写权限和执行权限是互斥的，这一条是核心安全保障，无论在什么情况下都是要遵守的。php 文件具有执行权限，但是上传文件的目录有写权限。

部署网站的时候一定要用低权限用户，能满足网站正常需要即可。

OAuth 过程

用户请求使用QQ登陆目标网站
目标网站重定向到QQ登录页
用户在QQ登陆页输入自己的用户名和密码
QQ登陆成功后跳转到目标网站
目标网站获取access_token
QQ服务器返回access_token
用户在目标网站登陆完成

整个OAuth的过程中用户只是获得了token。这里面有以下几个思想：

一切行为由用户授权
授权行为不泄露敏感信息
授权是会过期的

其实在我们自己的业务中也可以利用Oauth的思想防止资料泄露。

这样的系统有以下几个特点：

用户需要授权才能读取资料
不能批量获取数据
数据接口可以风控审计（例如 1 分钟内查了 1000 个用户的资料可以直接把服务停掉排查）

其他安全问题

DOS

TCP 半连接
HTTP 连接
DNS：一般带宽很小，攻击 DNS 是一种非常有效的方案

DDOS 是大规模分布式拒绝服务攻击，流量可以达到几十或者上百G，用户来源非常广，很难区分正常用户和攻击者，非常难防御。

更严重的是攻击流量非常大影响到骨干网的时候运营商可能直接把机房流量给你下了，这个时候你的网站自然没人访问了。常见的案例是恶意竞争者攻击别人的游戏服务器。

虽然难防，但是我们也是可以做一些有限事情的：

防火墙
交换机，路由器
流量清洗
高防IP（把域名解析到高防IP，背后是大规模的流量清洗服务，能提供非常大的带宽）

开发时候的预防：

避免重逻辑业务
快速失败返回（负载越高，越容易失败，重试几率越大，服务越容易崩溃）
防雪崩机制
有损服务（保证核心服务可用）
CDN

面试套路 - Web 安全

XSS

危害

分类

防御措施

CSRF

防御措施

XSS与cookie的关系

CSRF和cookie的关系

点击劫持

传输安全

密码安全

接入层注入问题

SQL注入的防御

NoSQL的注入和防御

接入层上传问题

OAuth 过程

其他安全问题

DOS

参考链接

面试套路 - Web 安全

XSS

危害

分类

防御措施

CSRF

防御措施

Cookie 的安全性

XSS与cookie的关系

CSRF和cookie的关系

点击劫持

传输安全

密码安全

接入层注入问题

SQL注入的防御

NoSQL的注入和防御

接入层上传问题

OAuth 过程

其他安全问题

DOS

参考链接