问题排查的方法

方法一:按时间顺序分析 (Chronological Analysis)

根据问题发生的时间线,回溯最近发生了哪些情况和做了哪些变更,通过回溯找到发生问题的原因

方法二:深度价值分析 (Pain Value Analysis)

根据事件的重要性和特点找到其核心点,并根据核心点分析产生问题的核心

方法三:KTKT 分析 (Kepner and Tregoe)

对发生的问题进行定义,对问题的特征进行描述,通过定义和特征逐一排查,找到可能导致问题的原因

方法四:头脑风暴 (Brainstorming)

大家一起什么都想,快速获得任何和问题相关的信息,但是得到信息往往不够客观

方法五:鱼骨图 (Ishikawa Diagrams)

将发生的问题看成一个主线,分析每一条汇入这条主线的分线,这些分线都有可能导致最后出现在主线上的问题,最终找到导致主线问题的原因在哪条分线上

方法六:帕累托分析 (Pareto Analysis)

分析哪些问题影响最大,先解决所有问题中最重要的那 20%,因为往往解决最重要的 20% 问题可能就会达到 80% 的效果

方法七:5 个为什么 (5 Why)

5 个为什么只是一个抽象的概念,真实情况是对发生问题的原因一只追问下去,先问导致问题的原因是什么,根据这个原因再问导致这个原因的原因是什么,直到问到根本原因以后才停止,此方法由日本丰田公司大野耐一发明。使用此方法需要注意:
1) 避免使用借口回答问题
2) 避免在追问的过程中牵扯到人的心理
3) 避免回答问题时推卸责任
4) 避免各个问题之间没有层级关系

[内容] Linux 常见存储和存储类型介绍

内容一:常见的存储

1) DAS(直连存储),就是接在主板上的硬盘
2) NAS(网络附加存储),例如:NFS、Samba、FTP、HTTP,优点是管理简单,缺点是单点故障
3) SAN(网络块存储),例如:Iscsi
4) 分布时云存储,例如:Ceph、Swift

内容二:常见的存储类型

1) Block-based access(基于块存储的访问),对应的是块存储(block),例如:直接接在主板上的硬盘、Iscsi、Ceph
2) File-based access(基于文件系统的访问),对应的是文件系统存储(filesystem),例如:NFS、Samba、FTP、HTTP、Ceph
3) Object-based access(基于对象的访问),对应的是对象存储(object),例如:Ceph

[内容] 实现数据存储高可用的思路

方法一:以目录级数据同步工具 Rsync 为核心的同步方法

通过 Inotifywait + Rsync 实现两个目录的数据实时同步
特点:如果数据量太大就不合适了,数据量最好小于 10G,如果文件多最好要小于 5G 甚至小于 3G

方法二:以硬盘级数据同步工具 DRDB 为核心的同步方法

DRDB + heartbeat 或者 DRDB + Keepalive + Shell 实现两个数据存储节点的主从同步、主从切换
特点:最好用于小于 300G 的数据同步

方法三:分布式云存储

通过 HDFS 或者 Ceph 实现分布式云存储
特点:可以用于大于 300G 的数据同步