博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
HDFS详细分析二
阅读量:7081 次
发布时间:2019-06-28

本文共 776 字,大约阅读时间需要 2 分钟。

1)HDFS读过程

DistributedFileSystem -> FSDataInputStream -> DFSClient.open(RPC通信机制) -> NN.open
 
HDFS写过程
DIstributedFileSystem -> FSDataOutputStream -> DFSClient.create(RPC通信机制) -> NN.create
 
2)SecondaryNamenode的作用与机制
SecondaryNamenode不是完全意义上的Namenode的一个备份
拉取FSimage和edits文件在SNN的内存中进行合并
fs.checkpoint.period
fs.checkpoint.size
fs.checkpoint.dir
 
 
checkpoint node (和secondaryNamenode一致,Hadoop2中secondaryNamenode已被此替代)
 
backup node 完全意义上的Namenode备份
 
 
3)一旦丢失Namenode或者元数据信息,我们可以通过SecondaryNamenode的检查点目录回复我们的元数据信息
hadoop namenode -importCheckpoint
hadoop-daemon.sh start namenode
 
4)机架感知
默认情况下所有的Datanode认为是处于同一个机架,不管物理上是否处于用一个机架
/default-rack
如果需要配置真正的网络拓扑结构,需要配置以下文件:
topology.script.file.name属性值是一个脚本,这个脚本里面写的是真正意义上的网络拓扑结构
/d1/reck1/dn1

 

转载于:https://www.cnblogs.com/litaiqing/p/4614971.html

你可能感兴趣的文章
黑马程序员-面向对象-07天-1 (抽象类描述)
查看>>
GPGPU之应用于Mapped Reduced
查看>>
简单的记录一下JavaScript 高级应用
查看>>
HTML简介
查看>>
bzoj2467 [中山市选2010]生成树
查看>>
自动流水号
查看>>
zabbix server3.4 使用mailx配置邮件报警
查看>>
java的托盘图标
查看>>
C#使用反射得到属性然后创建xml文档
查看>>
发布网站
查看>>
闭包的理解
查看>>
重新认识贝叶斯公式
查看>>
sqlserver 2008 R2容灾方案:另一种思路-1
查看>>
SQL Server 内存使用量下降问题
查看>>
CSS复习巩固(1)——跟我一起学编程
查看>>
CF 1136B Nastya Is Playing Computer Games
查看>>
网络安全基本概念
查看>>
JAVA学习(三):Java基础语法(变量、常量、数据类型、运算符与数据类型转换)...
查看>>
「Android 开发」入门笔记
查看>>
eclipse不自动弹出提示的解决办法(eclipse alt+/快捷键失效)
查看>>