PostgreSQL和Greenplum 数据库故障排查
2018年PostgreSQL中国技术大会 PostgreSQL和Greenplum 数据库故障排查 赵振平 zzp@taryartar.com 北京太阳塔信息科技有限责任公司 2018年PostgreSQL中国技术大会 自我介绍 微信号:laohouzi999 2018年PostgreSQL中国技术大会 • 赵振平,太阳塔技术总监 • 电子工业出版社签约作家 • 腾讯最具价值专家(TVP) 2018年PostgreSQL中国技术大会 微信号:laohouzi999 2018年PostgreSQL中国技术大会 PG故障排查 微信号:laohouzi999 2018年PostgreSQL中国技术大会 微信号:laohouzi999 1.安装时候的问题排查 2018年PostgreSQL中国技术大会 微信号:laohouzi999 1)关闭防火墙 service iptables 在生产环境中使用。 reject reject是拒绝认证 2018年PostgreSQL中国技术大会 微信号:laohouzi999 4. PostgreSQL启动故障排查 2018年PostgreSQL中国技术大会 微信号:laohouzi999 2018年PostgreSQL中国技术大会 微信号:laohouzi999 2018年PostgreSQL中国技术大会0 码力 | 84 页 | 12.61 MB | 1 年前3一次线上java 应用响应时间过长问题的排查
链滴 一次线上 java 应用响应时间过长问题的排查 作者:xinzhongtianxia 原文链接:https://ld246.com/article/1569574881351 来源网站:链滴 许可协议:署名-相同方式共享 4.0 国际 (CC BY-SA 4.0)最近接手一个老 java 应用,没多久接到响应时间太长的报警,整个排查过程还是挺有意思的, 录一下。
整个过程中,设计到 cpu,内存,垃圾回收,引用,spring, 单例 等等知识,整个下来,心情愉悦。< p>接到报警
想想这样设计也没问题,这和线程池的思想是一样的,我们使用线程池时,肯定不会每次都 new 一 新的,只不过这个 ossClient 隐藏的比较深。。。 原文链接:一次线上 java 应用响应时间过长问题的排查解决
解决办法很简单,把 OssClient 改成单例就行了。
但是,集团封网期间不允许上线,这。。。
没办法,把应用重启一遍,JVM 内存满血复活,清醒0 码力 | 3 页 | 247.74 KB | 1 年前3美团点评2018技术年货
LruCache在美团DSP系统中的应用演进 22 ...................................................................... Netty堆外内存泄露排查盛宴 32 ...................................................................... Oceanus:美团HTTP流量定制化路由的实践 美团在线营销DSP团队诚招工程、算法、数据等各方向精英,发送简历至cuitao@meituan.com,共同支 持百亿级流量的高可靠系统研发与优化。 Netty堆外内存泄露排查盛宴 - 美团技术团队 Netty堆外内存泄露排查盛宴 Netty堆外内存泄露排查盛宴 作者: 闪电侠 导读 导读 Netty 是一个异步事件驱动的网络通信层框架,用于快速开发高可用高性能的服务端网络框架与客户端程 序,它极大地简化了 Bug。美团的价值观一直都是“追求卓越”,所以我们就想挑战一下,找到那只臭虫(Bug),而本文就是 遇到的问题以及排查的过程。当然,想看结论的同学可以直接跳到最后,阅读总结即可。 问题 问题 某天早上,我们突然收到告警,Nginx 服务端出现大量5xx。 Netty堆外内存泄露排查盛宴 - 美团技术团队 我们使用 Nginx 作为服务端 WebSocket 的七层负载,5xx的爆发通常表明服务端不可用。由于目前0 码力 | 229 页 | 61.61 MB | 1 年前3Nacos架构&原理
Metrics 的暴 露,持续通过官网等渠道完善使用文档,多语言 SDK 的开发等。 从社区活跃度的角度来看,目前由于 Zookeeper 和 Eureka 的存量用户较多,很多教程以及问题 排查都可以在社区搜索到,这方面新开源的 Nacos 还需要随着时间继续沉淀。 集群扩展性 集群扩展性和集群容量以及读写性能关系紧密。当使用⼀个比较小的集群规模就可以支撑远高于现 有数量的服务注册及 等技术,来运行用户扩展约 定的接口,实现用户自定义的逻辑。在 Server 的设计中,用户扩展是比较审慎的。因为用户扩展 代码的引入,可能会影响原有 Server 服务的可用性,同时如果出问题,排查的难度也是比较大的。 设计良好的 SPI 是可能的,但是由此带来的稳定性和运维的风险是需要仔细考虑的。在开源软件中, 往往通过直接贡献代码的方式来实现用户扩展,好的扩展会被很多人不停的更新和维护,这也是⼀ 凡事都有两面性,微服务在提升业务应用的迭代速度和敏捷性的同时,也给服务治理带来了更多的 挑战。原先是单体应用,所有的服务都在⼀个进程中,服务之间的调用就是方法调用,整条请求的 处理流程就在当前线程中,调试、排查问题非常方便。 改造成微服务架构之后,原先单体中的服务变成⼀个个独立部署运行的服务,方法调用变成了远程 调用。首先要解决的问题就是服务发现问题,Consumer 服务如何在运行时发现 Provider0 码力 | 326 页 | 12.83 MB | 9 月前3Rainbond安装与运维原理解读
1. Rainbond安装与运维原理理解读 1.1 安装原理理 1.2 集群运维原理理 2. Rainbond安装与运维经验分享 2.1 常⻅见安装问题的排查 2.2 集群运维问题的排查 ⼤大纲 RAINBOND 线上培训(第九期) 2019/8/8 写在前⾯面 RAINBOND 线上培训(第九期) 2019/8/8 我们的培训课件PPT,在未来会越来越短,这是为什么呢? 这是为什么呢? 1. 我不擅长写PPT 2. 我司升职不靠写PPT 3. 以上两点都是 BULL SHIT! 最重要的是: 我们认为,我们应该把我们产品的原理、使⽤经验技巧、遇到问题排查思路全部 沉淀在⽂档中。通过引导⽤户阅读⽂档,传输我们的产品理念、复制我们的运维能⼒、让⽤户 真正掌控RAINBOND这款产品。 1. RAINBOND安装与运维原理理解读 1.1 安装原理理 ps -ef | grep 服务组件名称 2. RAINBOND安装与运维经验分享 RAINBOND 线上培训(第九期) 2019/8/8 2.1 常⻅见安装问题的排查 Rainbond安装问题排查⽂文档 https://www.rainbond.com/docs/troubleshoot/install-problem/ 该阶段⽤用户正在安装⼀一个Rainbond0 码力 | 12 页 | 311.60 KB | 1 年前3Go在工程实践的错误处理
封装组件 充足信息 gRPC错误日志:param error 哪个Client 调用? 哪一行代码 调用? 我的 参数问题? 对方的问题? ... 遇到一个问题,我们就追加一个日志字段,排查错误效率非常低 为什么调试慢?-- 错误信息 高亮信息 封装组件 充足信息 对端信息 请求方法 请求参数 响应数据 状态信息 耗时时间 执行行号 能够确定对端的唯一来源,例如对端的应用名称、对端的 错误码唯一性 记录一次错误 假设用户反馈了无法打开一个文件 我们的程序员非常认真 记录了文件不存在的错误日志 • 同样的错误信息,非常多的杂音 • 每个Error,都去查看一次对应代码,排查效率低 • 占用存储空间 • 最外层入口处只记录一次错误日志 为什么定位慢?-- 错误处理 带来新的问题,无法定位整个代码执行链路 两个service方法都调用了 findMysqlFile 文件删除了 • 一个问题,多种原因 • 无法一次性确定问题,仍需查看代码以确定具体情况 • 错误码唯一性,准确的反映出错误的根因,才能快速定位问题 如果不在写代码的时候花时间做唯一错误码,那么只能在排查的时候 花更多时间查问题 并没有定位到根本问题 分布式错误处理 第四部分 为什么定位慢?-- 分布式错误 TraceId 分布式信息 在微服务体系中,每个应用会涉及多种组件和调用多个业务API,0 码力 | 30 页 | 3.11 MB | 1 年前3Apache RocketMQ 从入门到实战
RocketMQ 集群。本书不仅由浅入深的介绍了 RocketMQ 的架 构与实现,而且包含了多年线上超大规模集群开发运维经验的总结,通过本书不仅能够掌握 分布式消息平台的设计原理,对线上疑难问题排查分析、性能调优与架构设计也大有帮助。 目录 开篇:我的另一种参与 RocketMQ 开源社区的方式 6 1.1 RocketMQ 核心概念扫盲篇 10 1.2 生产环境中,autoCreateTopicEnable 踩坑记:rocketmq-console 消费 TPS 为 0,但消息积压数却在降低是个什么 “鬼” 49 1.6 RocketMQ 一个新的消费组初次启动时从何处开始消费呢? 64 1.7 一次 RocketMQ 进程自动退出排查经验分享 78 1.8 RocketMQ 主题扩分片后遇到的坑 82 1.9 RocketMQ 消息发送 system busy、broker busy 原因分析与解决方案坑 91 1.10 再谈 最后就启动消费者,从队列最大偏移量开始消费。 本文来自『中间件兴趣圈』公众号,仅作技术交流,未授权任何商业行为。 1.7 一次 RocketMQ 进程自动退出排查经验分享 < 78 1.7 一次 RocketMQ 进程自动退出排查 经验分享 一、背景 公司一个 RocketMQ 集群由 4 主 4 从组成,突然其中 3 台服务器“竟然”在同一时 间下线,其监控显示如下: 三台机器的图形,时间戳几乎完美“吻合”。0 码力 | 165 页 | 12.53 MB | 1 年前3TiDB v5.2 中文手册
· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 305 8.5.7 排查示例 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 338 8.10 乐观事务模型下写写冲突问题排查· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 339 8.10 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 624 11.4.6 TiUP 故障排查 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·0 码力 | 2259 页 | 48.16 MB | 1 年前3TiDB v5.4 中文手册
· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 390 8.6.7 排查示例 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 426 8.12 乐观事务模型下写写冲突问题排查· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 427 8.12 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 432 8.14.1 使用 Lock View 排查锁相关的问题 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 432 80 码力 | 2852 页 | 52.59 MB | 1 年前3TiDB v5.3 中文手册
· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 321 8.5.7 排查示例 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 357 8.11 乐观事务模型下写写冲突问题排查· · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 358 8.11 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · 649 11.4.6 TiUP 故障排查 · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · · ·0 码力 | 2374 页 | 49.52 MB | 1 年前3
共 161 条
- 1
- 2
- 3
- 4
- 5
- 6
- 17