san lunboot 需要单独一个lun吗

LUN的全称是Logical Unit Number,也就是逻辑单元号,是SCSI中的概念。
我们用Target ID(也有称为SCSI
ID的)来描述这些设备,设备只要一加入系统,就有一个代号,我们在区别设备的时候,只要说几号几号就ok了。
早期的SCSI系统采用3个ID,一个SCSI总线上只能接驳8个设备,除了SCSI控制卡占用了一个ID外,只剩7个设备号可用。尽管SCSI以后采用了4位ID,扩展到了16个设备,但对于现代的存储设备,这种个位数的ID识别号显然不够用。目前生产环境上多产用RAID技术来规划存储,通过RAID组合后的磁盘不再能看到单独的磁盘信息,而是变成了一个巨大的存储空间。古老的RAID技术只能将此存储空间整体分配,被指定了一个LUN后,成为了一个“逻辑”磁盘,供接驳的计算机使用。
鉴于上述种种原因,于是我们引进了LUN的概念,也就是说LUN ID的作用就是扩充了Target
ID。每个Target下都可以有多个LUN Device,我们通常简称LUN
Device为LUN,这样就可以说每个设备的描述就有原来的Target x变成Target x LUN
y了,那么显而易见的,我们描述设备的能力增强了,同时也能对存储空间内的磁盘进行单独的管理。就好比,以前你给别人邮寄东西,写地址的时候,可以写:
xx市人民大街54号 xxx(收)
但是自从高楼大厦越来越多,你不得不这么写:
xx市人民大街54号xx大厦518室 xxx (收)
所以我们可以总结一下,LUN
ID不等于某个设备,只是个号码而已,不代表任何实体属性,在我们的实际环境里,我们碰到的LUN可能是磁盘空间,可能是磁带机,或者是media
changer等等。
LUN就是我们为了使用和描述更多设备及对象而引进的一个方法而已,一点也没什么特别的地方。
还要说明的地方是,在有些厂商和有些产品的概念里,LUN
ID被绑定到了具体的Device上,比如IBM的一些带库,整个带库只有一个Target ID,然后changer,tape
drive被分别分配为LUN0、LUN1、LUN2…,但是我们要注意到,这只是产品做了特别设计,也是少数情况。
存储和主机的LUN概念区别
在磁盘阵列和磁带库大行其道的时代,存储越来越智能化,越来越像一个独立的机器,实际上存储和主机的电气独立本来就是一个必然趋势,俗话说得好,儿大要分家嘛。在存储越来越重要的时代,存储要自立门户是必然的事。
如果我们把存储当作一个独立的主机来看,理解起来就很简单了。我们说到LUN的概念的时候,我们就要将分为两个层面。一个层面就是在阵列这个机器的OS识别到的范围,另一个层面就是服务器的OS识别到的范围。这两个层面是相对独立的,因为如果我们把存储当作一个主机来看,那么它自然有自己的Device、Target、LUN之说,而服务器也有自己的Device、Target、LUN之说;另外一方面,这两个层面又是相互关联的,一个阵列的控制系统,大多都有虚拟化的功能,阵列想让主机看到什么样的东西,主机才能看到相应的东西。当然,服务器识别到的最小的存储资源,就是LUN级别的。那么主机的HBA卡看到的存储上的存储资源就主要
靠 两个东西来定位,一个就是存储系统的控制器(Target),一个就是LUN
ID,这个LUN是由存储的控制系统给定的,是存储系统的某部分存储资源。
LUN masking,LUN
mapping和Zone
我们有了独立的磁盘阵列用了之后,服务器只要看到存储的控制系统,就有可能使用磁盘阵列的磁盘资源,但是磁盘阵列不可能只为某一个服务器来使用,所以它必须管制主机使用某部分磁盘资源。实现这种管制的主要技术有:LUN
mapping,LUN masking和Zone。
LUN masking
masking是指LUN与主机HBA卡的WWN地址绑定,与主机HBA卡建立一对一或多对一的连接和访问关系。无论主机跳线到同一个FABRIC(无
zone设置)的哪一个端口上,主机都能识别到相同的LUN。存储设备一般默认在卷和主机间建立多对一的对应关系,即一台主机可访问存储设备上的多个卷。
每块磁盘都在一个队列里,磁盘分区也能被分配成LUN。当多台计算机在同一时间访问同一磁盘时将会导致磁盘数据的混乱。如果你应用LUN
masking,那么一个单独的RAID将被分到多个逻辑磁盘上,这些磁盘都分配给了指定的计算机。通过LUN
masking,只有特定的LUN才能被特定的SCSI卡访问。不仅是SCSI接口的磁盘阵列,由于FC实际使用的也是SCSI协议,因此较新的FC磁盘阵列也可有提供LUN
masking功能。被划分完的LUN设备会属于一个Host
Group中。同一Group中的FC卡,能访问这个Group中的LUN,而不能跨越Group访问指派给别的Group的LUN
逻辑单元数掩码(LUN
masking)是以独立磁盘冗余阵列(RAID)为中心的,在一个端口掩码多个LUN的加强型方法。LUN
masking在存储控制器级别上进行
主机HBA的WWN绑定,因此存储控制器能够将不同LUN划分给一个或多个主机,可以提供LUN级别的访问控制。
masking也允许磁盘存储资源在多个独立服务器之间共享。单个的大容量RAID设备可以划分子模块,之后通过带LUN
masking功能的SAN光纤通道连到RAID上的不同主机上,提供服务。所以,只有一个或者有限的服务器可以看到LUN
(例如,磁盘薄片,部分,单元), 可对RAID设备中的每个LUN进行限制。
但并不是所有的RAID设备具有LUN masking能力,这样,为了设置LUN masking,
一些HBA厂商允许在驱动器级进行持久绑定(persistent binding)。
LUN Mapping
LUN Mapping是LUN与存储设备的主机端口进行绑定,工作站连接不同的主机端口时所能访问的LUN不同。
当一个存储系统同时为多个应用系统提供数据存储服务,且不同应用系统的主机分别处于不同的地理地址时,有可能用到第二种LUN
Mapping方式。即将不同的LUN与不同的存储主机端口绑定,不同的主机端口与不同的FC交换机或者不同的ZONE连接,从而实现不同的工作站只能访问不同的端口。
一个LUN Mapping中所对应的LUN和存储主机端口(WWPN)成为一个分区。由于存储设备的主机端口数量是一定的,如果划分的LUN
Mapping分区越多,分区中存储主机端口就会越少。存储设备的冗余链路连接功能就越小,当一个分区里只能设置一个主机端口时,存储就失去了冗余链路连接功能,整个系统极易因存储主机端口和交换机端口的故障而发生单点故障。
当系统无FC交换机,主机与存储设备的主机端口直连时,通过LUN
Mapping实现起来LUN分区非常方便。当所有主机端口都连接到同一个FABRIC时,就需要与
FCswitch的ZONE结合起来一起使用,来实现数据通信的隔离。
不同厂商对LUN Masking和LUN Mapping的定义和解释不完全相同。有的甚至就定义成一个名称,如SAN
SHARE,而有的存储干脆就没有LUN Masking和LUN Mapping功能。
在早期的SAN方案中,服务器大多是同种操作系统,SAN环境下的安全性问题并不突出。但是现在的方案中,异种操作系统并存的需求比比皆是,多套磁盘阵列
子系统或具有多个主机接口的磁盘阵列子系统也很常见。为了保证SAN正常工作,不互相破坏数据。基于FC存储交换机层面的Zoning
分区划分,可以有效提供一种解决方案。这样服务器只能访问同一分区内的设备,提高设备访问的安全性.
很多用户将Zoning 分区和LIP 隔离混淆,认为Zoning 就是LIP 隔离,实际情况为两者是不同的概念。
存储交换机遵循FC-AL协议工作时,一般所有的设备之间协商AL_PA地址(或常说的Loop_ID),这个过程我们称为环路初始化(LIP)。SAN上有任何新的设备启动都会引起LIP,这时所有的机器停止工作进行地址协商,因此LIP会使系统中断工作.
FC存储交换机遵循FC-SW协议工作时,需要特殊的服务来确保SAN正常工作,与上面所说LIP相类似的一个服务就是RSCN。设备做完Fabric
Login后会向交换机登记许多信息,当该设备关闭或重新启动时就会引起登记状态的改变,RSCN服务就是负责将登记状态改变信息通知SAN上的所有设
可见,LIP和RSCN都对SAN的正常工作造成破坏,对于一些特殊关键应用甚至是致命的,如视频流应用和磁带库备份应用。根据FC-AL协议标准,LIP一般需要15毫秒,而遵循FC-SW
协议的RSCN根据实际的SAN环境的复杂程度,甚至影响正常通讯达数秒。
对于不具备LIP隔离功能的交换机,在解决RSCN 影响问题时,只能靠Zoning
分区的方法使一个分区的设备对其他分区的设备减轻冲击。但是,在视频流应用的实际测试效果来看,仍然对正常通讯的设备性能造成了较大的影响.
进行zone划分有两种方式:
1.基于端口的Hardware
Zoning(硬件分区)划分,可以产生直观、清晰的逻辑划分,在实践中被大量使用。
2. Software Zoning(软件分区)方法,即基于WWN (World Wide
Name) 进行分区。不过,软件分区在实际使用中较少使用.
SWITCH上的ZONE功能类似于以太网交换机上的VLAN功能,它是将连接在SAN网络中的设备(主机和存储),逻辑上划到为不同的区域内,使得不同区域中的设备相互间不能FC网络直接访问,从而实现网络中的设备之间的相互隔离。
Zoning分区可具有以下特点:
a. 分区可以重叠、同一设备可属于不同分区
b. 分区可以在设备运行时动态划分
c. 使不同的操作系统可以在一个SAN里共存
假设两台FC交换机通过级连线连接成一个fabric。红色区域的交换机端口属于ZONE 1,绿色区域属于zone
2,蓝色区域属于zone 3,橙色区域既属于zone 1又属于zone 3,白色为扩张端口区域,不需要定义zone。
在这两台FC交换机组成的fabric中,凡是红色区域zone
1中的设备之间都可以相互访问,但是不能访问绿色区域和蓝色区域中的设备,但可以访问橙色区域中的设备,因为橙色也属于zone
蓝色区域与红色区域相似。
绿色区域zone 2中的设备之间只能可以相互访问,别的任何区域的设备。
橙色区域中的设备既可以访问红色区域中的设备,又可以访问蓝色区域中的设备,但不能访问绿色区域中的设备。
按照中方法,无论存储系统的结构有多么复杂,都可以通过画图的方式把LUN、存储设备主机端口,交换机端口和工作站之间的关系分析清楚。
masking和Zone比较
由上文可以知道,LUN
masking和zone的功能都是将特定的LUN划分给特定的主机来实现数据隔离,这两项技术的具体区别如下:
1、交换机里面那个隔离的功能叫Zoning,该功能能做一些隔离和访问限制,但是是基于端口层次的。如果要把一个端口连接的多个LUN区别对待,Zoning就不行了,就得靠阵列控制器里面的Lun
Masking功能了。例如,通过同一个端口连接的LUN需要分配给多个主机,那么就需要Lun Masking。
masking是在存储控制器或者HBA卡上进行的,可以控制主机访问特定的LUN。Zone
发生在SAN中的交换机上,他将不同的存储正列和主机划归到不同的zone中。
zone是通过交换机端口的强制物理的隔离masking是逻辑隔离,物理没有隔离。在多台服务器连一台或者多台存储用。存储设备有很多,主机不同应用有很多,OS有很多
时,zone能很好的隔离数据。 根据前文所述,LUN masking和只能
主机HBA卡建立一对一或多对一的连接和访问关系,
如果在一个LUN对应多台主机的共享存储架构中,则只能通过zone来实现。 LUN
Masking的层面是逻辑的阵列内部,ZONE的层面除了一个设备以外,还有多个设备,而多个设备的情况下,显然这个存储的LUN
Masking不能给另外一个存储用。
如果交换机未划分zone那么连接到该换机的主机将可任意访问连接到该交换机的LUN。同时在交换机上划分多个zone也可以有效防止当单个zone失效的时候,影响到其他zone!
因此当主机或者存储特别多的时候,zone就变得很有意义。
4、划分zone还一方面是
FC协议本身的问题,在出现意外的情况时,会产生RSCN公告,大量的RSCN时会影响到正常使用,影响NameServer的正常工作,和响应
Login,通过HardwareZone隔离设备是ZONE的功能之一。也正是因为这样,我们划分ZONE的原则是Single HBA
ZONE。现在交换机都采用FC-SW协议了,以前老的loop协议的时候产生LIP,产生LIP会让数据中断。
参考至:/view/541220.htm
&&&&&&&&&&&&
http://bbs.chinaunix.net/viewthread.php?tid=586064
&&&&&&&&&&&&
.cn/showtopic-45530.aspx
&&&&&&&&&&&&
http://www.loveunix.net/viewthread.php?tid=108984
&&&&&&&&&&&&
http://bbs.chinaunix.net/thread-.html
&&&&&&&&&&&&
.cn/18911/viewspace-1997.html
&&&&&&&&&&&&
/SAN-Storage-FAQs/What-is-LUN-Masking.html
&&&&&&&&&&&&
/2008/06/lun-mapping-persistent-binding-lun.html
&&&&&&&&&&&&
/en-us/library/cc758640(WS.10).aspx
&&&&&&&&&&&&
http://searchstorage.techtarget.co.uk/answer/LUN-masking-or-LUN-zoning-Which-one-is-a-better-fit-for-a-SAN-fabric?ShortReg=1&mboxConv=searchStorageUK_RegActivate_Submit&
以上网友发言只代表其个人观点,不代表新浪网的观点或立场。1、启用客户机操作系统和远程控制台之间的复制和粘贴操作
解决方法:要在客户机操作系统和远程控制台之间进行复制和粘贴,必须使用 vSphere Client 启用复制和粘贴操作。
a、使用 vSphere Client 登录到 vCenter Server 系统并选择虚拟机。
b、在摘要选项卡中,单击编辑设置。
c、选择选项 & 高级 & 常规,然后单击配置参数。
d、单击添加行,并在“名称”和“值”列中键入以下值。
isolation.tools.copy.disable false
isolation.tools.paste.disable false
注意这些选项将替代在客户机操作系统的 VMware Tools 控制面板中做出的任何设置。
e、单击确定以关闭“配置参数”对话框,然后再次单击确定以关闭“虚拟机属性”对话框。
f、重新启动虚拟机。
2、sco系统迁移过去之后找不到启动列表
解决方法:目前解决方法:使用软驱制作应急盘,通过应急盘来找到启动列表,如果不行的话,只能使用,现成的虚拟镜像导入vmware中,但是这种方法,要自己设置与自己相关的应用。
3、linux做迁移时手动添加的逻辑分区(LVM卷),迁移过去之后找不到这些分区
解决方法::给虚拟机额外添加硬盘后融合,然后将数据重新拷入加入的硬盘中。
4、安装esxi的时候找不到万兆网卡
解决方法:解决方法:安装各个厂商OEM的esxi版本。
5、迁移时提示vss原卷不能克隆
解决方法:解决方法:查看是否有额外的设备插在服务器上,如usb设备。
6、Windows迁移之后,配置网卡的时候,会提示“IP已经被分配给其他的适配器”
解决方法:打开命令行窗口(运行cmd),输入:
(1)、set DEVMGR_SHOW_NONPRESENT_DEVICES=1
(2)、devmgmt.msc
在弹出的“设备管理器”窗口。选择“查看(V)”—“显示隐藏的设备(W)”,然后展开“网络适配器”子项,可以看到一些透明图标显示的网卡信息,这些信息是源服务器的物理网卡信息。然后选择透明的设备卸载,RAS同步适配器为系统正常设备,不需要将其卸载。
7、Asianux3.0迁移之后不能显示图形化界面
解决方法:解决方法:cp /etc/X11/xorg.conf /etc/X11/xorg.conf.bak
vi /etc/X11/xorg.conf
将xorg.conf文件中的selection “Devices”字段中Driver对应的值修改为“vmware”即可,修改完成后通过startx启动图形化界面。
8、迁移域控主机后发生当虚拟机开启后,物理机就断网
解决方法:单播和多播的问题
9、在VC中虚拟机的鼠标全屏之后,不能控制整个屏幕
解决方法:当时安装的是esxi 4.1,将esxi4.1升级到esxi4.1upd01 ,同时要将VC client也升级到对应的版本。
10、迁移过去的win2003的系统,隔段时间之后会蓝屏或重启
解决方法:查看系统日志,有可能是杀毒软件的原因,将杀毒软件卸载重装。
11、使用FT功能需同时具备以下条件
解决方法:1 所有ESX必须为4.0以上,Build版本相同,以及在同一个HA Cluster中
2 服务器的CPU要求是同一系列(并且要求是AMD Barcelona+, Intel Penryn+的CPU)
3 BIOS中要启用VT及禁用Hyperthreading(超线程),最好同时禁用电源管理
4 每个VM只能分配1颗vCPU
5 要有专门的千兆网络负责FT
6 VM要放在共享存储上
7 VM的配置文件必须为版本7
8 Guest OS不要启用Paravirtualized
9 启用FT的VM不支持自动DRS
10 启用FT的VM不支持Snapshot
11 启用FT的VM不支持 MS Cluster
12 启用FT的VM不支持物理RDM Mapping
13 启用FT的VM的虚拟CD-ROM最好断开
14 启用FT的VM不支持NPIV (N-Port ID Virtualization)
15 启用FT的VM不支持Device HotAdd/HotPlug
大型虚拟机可能会阻止使用容错
如果虚拟机太大(大于 15GB)或内存的变化速率大于 VMotion 通过网络进行复制的速率,
则启用容错或使用VMotion 迁移正在运行的容错虚拟机时可能会失败。
12、如何确认克隆后的系统SID是否更新
解决方法:Windows 、windows 7可使用本地账户登录系统,输入“whoami /user”查看Windows xp没有whoami命令,可通过注册表查看
13、vSphere所需要开放的端口
解决方法:80
vCenter Server需要端口80用于直接HTTP连接。端口80会将请求重定向到HTTPS端口 443。如果意外使用了http://server而不是https://server,此端口将非常有用。
此端口在vCenter Server的本地和所有远程实例上必须处于打开状态。这是vCenter Server组的目录服务的LDAP端口号。vCenter Server系统需要绑定端口389,即使没有将此 vCenter Server实例加入到
链接模式组。如果此端口上正在运行另一服务,则最好移除该服务,或将其端口更改为其他端口。可以在从的任一端口上运行LDAP服务。如果此实例充当Microsoft Windows活动目录,请将端口号从389 、更改为从 1025 到 65535 的任一可用端口。
vCenter Server系统用于侦听来自vSphere Client的连接的默认端口。要使vCenter Server从vSphere Client接收数据,请在防火墙中打开443端口。vCenter Server系统还使用端口443侦听从vSphere Web Access Client和其他SDK客户端传输的数据。如果对HTTPS使用另一个端口号,则登录vCenter Server系统时必须使用&ip-address&:&port&。
对于vCenter链接模式,这是本地实例的 SSL端口。如果此端口上正在运行另一服务,则最好移除该服务,或将其端口更改为其他端口。可以在从的任一端口上运行 SSL服务。
vCenter Server系统用于将数据发送到受管主机的默认端口。受管主机也会通过UDP端口902定期向vCenter Server系统发送检测信号。服务器和主机之间或各个主机之间的防火墙不得阻止此端口。
不得在vSphere Client和主机之间阻塞端口902和903。这些端口由vSphere Client 使用以显示虚拟机控制台。
Web服务HTTP。用于VMware VirtualCenter Management Webservices。
Web服务HTTPS。用于VMware VirtualCenter Management Webservices。
Web服务更改服务通知端口
如果希望vCenter Serve 系统使用不同的端口接收vSphere Client数据,请参见《VMware vSphere 数据中心管理指南
14、虚拟机文件有哪些
解决方法:
vmname.vmx
虚拟机配置文件
vmname.vmxf
其他虚拟机配置文件
vmname.vmdk
虚拟磁盘特性
-flat.vmdk
vmname-flat.vmdk 预分配虚拟磁盘
vmname.nvram 或 nvram 虚拟机 BIOS
vmname.vmsd 虚拟机快照
vmname.vmsn 虚拟机快照数据文件
vmname.vswp 虚拟机交换文件
vmname.vmss 虚拟机挂起文件
vmware.log 当前虚拟机日志文件
vmware-#.log(其中 # 表示从 1 开始的编号) 旧的虚拟机日志条目
15、如何更改vSphere Center的生成日志
解决方法:
修改“vpxd.cfg”文件,然后添加如下内容:
&directory&D:VMwareLogs&/directory&
调整日志文件的大小:
&maxFileSize&&/maxFileSize&
&maxFileNum&10&/maxFileNum&
保存之后,重启vCenter Server之后,即可生效
16、windows迁移必须在迁移机上开启的服务
解决方法:
需要注意5个服务不能被禁用
1)windows installer
2)volume shadow
3)TCP/IP netBIOS
5)workstation
如果 Converter Standalone 连接远程 Windows XP 计算机失败,并发出 bad username/password 的错误消息,
请确保 Windows 防火墙没有阻止文件和打印机共享。步骤
1 选择开始 & 设置 & 控制面板 & 管理工具 & 本地安全策略。
2 在左侧的安全设置列表中,选择本地策略 & 安全选项。
VMware vCenter Converter Standalone 用户指南
3 在右侧的策略列表中,选择网络访问:本地帐户的共享和安全模式。
4 确保选中经典 – 本地用户以自己的身份验证。
Windows Server 2008(确保启用了 Computer Browser Windows Service)
Windows XP(需要打开简单文件共享,启用文件和打印机共享)
17、Linux迁移注意事项
1)关闭防火墙(service etcinit.diptables stop)
2)SSH 必须打开(sshd start)
3)迁移时需要在help address时为虚拟机设置一个IP地址
redflag 迁移之后没有图形化界面,通过Xconfigurator来重新配置。
redhat 迁移之后没有图形化界面,通过system-config-display来重新配置。
4)迁移后的系统不带IP,需要手动设置
5)数据库或域需要关闭
6)建议冷迁
18、ESXi不能解析主机名
解决方法:
1) Login to ESXi host
2) vi /etc/hosts
3) Key in every ESXi host in Cluster as the following format
IP Address
ESXi hostname
192.168.10.10
192.168.10.11
… …
192.168.10.9
4) Repeat all the above editing in all ESXi hosts
5)Login in to vCenter
6)Edit /Windows/System32/drive/etc/hosts
19、SCO迁移后添加网卡不能使用
解决方法:
迁移完成之后,通过netconfig来把原来的网卡删除掉,(如果进入的是图形界面,选tool-unix进入命令窗口)不要把上面的HW SCO TCP/IP Loopback driver 这个网卡删掉。
删除下面的那个网卡,删除完成之后,后提示你重新配置内核,然后重新启动。选择sco虚拟机—编译–添加网卡。重启之后,通过netconfig来添加网卡,添加的是AMD PCNet-PCI Adapter Compatiable……的网卡,然后配置IP。
注意配置IP的时候那个broadcast address不要改,这个是广播地址。网关不需要配置。
20、Linux下安装VMware-tools出现“/etc/vmware-tools/locations”错误
A previous installation of VMware software has been detected.
The previous installation was made by the tar installer (version 3).
Keeping the tar3 installer database format.
Error: Unable to find the binary installation directory (answer BINDIR)
in the installer database file “/etc/vmware-tools/locations”.
解决方法:
1、删除etc/vmware-tools目录rm -rf vmware-tools
2. 删除/tmp/vm*
rm -rf vm*(注意不要把 VMwa*的也删除)
3、然后用tar –zxvf解压
21、所有的虚拟机开启或VMotion出现“文件&unspecified filename&被锁定,无法访问”
故障内容:环境的所有VM运行出现异常缓慢,关机后的虚拟机开机或VMotion出现“文件&unspecified filename&被锁定,无法访问”
解决方法:检查日志,特别是存储上LUN的占用情况,如果有存储使用空间接近预警状态,请登陆存储查看,一般这种情况,是存储空间已经没有空余导致,由于vSpherer4的BUG,有时候在没有报警的情况下,存储空间就已经满了情况。请增加存储或移除部分虚拟机。
22、Windows系统的虚拟机无法进入安全模式
解决方法:选中虚拟机右键“编辑设置”—“选项”–—“引导选项”,在“启动引导延迟”填上“1000”(1秒=1000毫秒,数字可以随便填,稍大一点即可)。然后启动按F8即可进入安全模式。
本文出自 “” 博客,请务必保留此出处
23、vSpherer4.1中32位win2003会不定时的关机,关机后无法再次登录
故障现象:客户的X86 Windows2003VM系统在使用中会不定时的关机。关机时间不确定,几个小时到几天,关机瞬间就像物理机断电一样,关机后的VM能再次开启,但只要输入账号和密码就立即关机,连安全模式也一样状况。其他X64VM系统没有任何问题。
解决方法:通过两个月的煎熬,排除了网络病毒、物理硬件和系统版本的原因,通过不断的分析ESXi和主机日志,发现有类似如下日志
Sep 07 01:45:03.709: mks| SOCKET 10 (91) recv error 104: Connection reset by peer
Sep 07 01:45:03.709: mks| SOCKET 10 (91) destroying VNC backend on socket error: 1
Sep 07 03:26:42.676: vmx| Vix: [ mainDispatch.c:907]: VMAutomation_PowerOff: Powering off. (VM Powering off)
通过400长期的周旋,发现这是7月底发现的BUG,通过在ESXi主机下输入命令:
/etc/init.d/sfcbd-watchdog stop
chkconfig sfcbd-watchdog off
chkconfig sfcbd off
问题解决,但VC上插件和监控状态失效,去官网(/selfservice/microsites/search.do?cmd=displayKC&docType=kc&docTypeID=DT_KB_1_1&externalId=2000609)下载最新补丁,安装,一切OK。
24、VM(windows2003)全屏最大化后,鼠标移动缓慢或错位
解决方法:
1、查看是否安装VMware-tools
2、查看系统内硬件加速是否开启(完全)
3、将虚拟机分辨率调整为:800×600
4、到控制台中打开,上面菜单栏中à视图à自动匹配窗口勾去掉
5、查看虚拟机中的显卡驱动是否为:VMware SVGA II
一般情况下,这5点中,满足1、2、3基本可以解决问题,如果全部满足还不行那你只能阿弥陀佛了。当然前提是你已经排除VM OS本身的问题如CPU或内存占用比较大,存储读写延时等等。(注:附件中有图片)
24、用VDR备份无法创建静默快照,因为创建快照操作超过了拖延已冻结虚拟机中 I/O 的时限。
解决方法:停止服务VMware Tools Services,打开Vmware Tools安装程序,选择Modify。不要安装Volume Shadow Copy Services Support,完成后重启VM.
25、如何从本地上传下载文件到ESXi主机
解决方法:1、可以通过ESXi的命令SCP上传和下载,在没有三方工具的情况下这个命令需要需要通过另外一台Linux中转才能把需要的文件上传和下载要需要的文件下。
2、由于Client登陆VC后,可以在上面看到共享的存储空间和本地硬盘,这说明ESXi主机内一定有一个文件同样也可以看到这些空间。经过分析发现/vmfs/volumes/目录就是存储和本地硬盘的存放点。可以通过这个目录上传和下载ESXi主机中的文件。
26、在 vCenter Server 升级到 5.0 版本后,ESX 4.0 Update 2 主机可能崩溃
解决方法:发生崩溃时,同时在紫色屏幕上显示以下消息:NOT_IMPLEMENTED bora/vmkernel/filesystems/visorfs/visorfsObj.c:3391。
解决办法:升级到 vCenter Server 5.0 之前,将由 vCenter Server 管理的所有 ESX 4.0 Update 2 主机升级到 ESX 4.0 Update 3。
27、HA配置到90%时失败,提示:Internal AAM Error-agent could not start
故障状态:
1、第一台主机加入到Cluster没问题,但是第二台主机加入到cluster时,走到90%出错,提示如下错误:Internal AAM Errors-agent could not start
2、在aam_config_util_addnode.log文件里有类似如下错误信息:
01.01/23/10 16:20:49 [myexit ] Failure location:
02.01/23/10 16:20:49 [myexit ] function main::myexit called from line 2199
03.01/23/10 16:20:49 [myexit ] function main::start_agent called from line 1168
04.01/23/10 16:20:49 [myexit ] function main::add_aam_node called from line 171
05.01/23/10 16:20:49 [myexit ] VMwareresult=failure
故障分析:
这种故障一般和UDP 8043端口无法访问有一定关系;
解决方案:
确保UDP 8043端口畅通无阻,比如:
执行如下命令:
tcpdump -i vswif0 -s 900 -n udp port 8043 -w ${主机名}.pcap
28、查阅和重装VirtualCenter Server agents(vpxa)服务
故障状态:
·配置VMware High Availability (HA) 失败;
·重新配置 VMware HA时,提示如下错误:
Could not Enable aam firewall ruleset :vim.fault.HostConfigFault
·无法将ESX添加到VirtualCenter;
·尝试重新将ESX添加到VirtualCenter时,提示如下错误:
unable to access the specified host, either it doesn’t exist, the server software is not responding, or there is a network problem
·在hostd.log文件中有如下内容:
[ 10:45:51.463 ‘Vmomi&#12 info] Throw vim.fault.AlreadyExists
[ 10:45:51.463 ‘Vmomi&#12 info] Result:
(vim.fault.AlreadyExists) {
name = “vpxuser”
msg = “”
备注:当看到如下错误时,请在ESX主机上重装vpxa:
unable to access the specified host, either it doesn’t exist, the server software is not responding, or there is a network problem.
查看安装在ESX/ESXi服务器上的VirtualCenter agent(vpxa)版本号的方法如下:
1.首先确定VirtualCenter的版本号:点击Help按钮,点击About可查阅;
命令查看VMware-vpxa的命令:
rpm -V VMware-vpxa
29、使用IBM服务器可能导致ESXi/ESX 4.1服务器HBA卡和PCI设备停止响应
故障状态:
当使用IBM x3650 M3或BladeCenter HS22V服务器时,可能会在ESXi/ESX 4.1上遇到下面的问题:
1、HBA卡停止响应;
2、某些PCI设备无响应;
3、可以在ALT+F12界面和日志信息里看到这样的信息:
vmkernel: 6:01:34:46.970 cpu0:4120)ALERT: APIC: 1823: APICID 0x – ESR = 0x40
4、HBA卡停止响应,例如:
vmkernel: 6:01:42:36.189 cpu15:4274)&6&qla2xxx.0: qla2x00_abort_isp: **** FAILED ****
vmkernel: 6:01:47:36.383cpu14:4274)&4&qla2xxx .0: Failed mailbox send register test
5、HBA卡可能进入离线状态,例如:
vmkernel: 6:01:47:36.383 cpu14:4274)&4&qla2xxx .0: ISP error recovery failed – board disabled
故障分析:
具体问题还不太清楚,期待VMware官方能够给出解释并放出相关补丁;
解决方案:
在ESXi/ESX 4.1里面雀圣启用了中断重映射代码,而这个代码和部分IBM服务器不兼容,可以通过禁止掉这个代码缺省启动的方式来临时解决这个问题:
1、进入到命令行界面,执行如下命令:
#esxcfg-advcfg -k TRUE ioDisableIR
2、重启后检查这个选项是否依然缺省启动:
#esxcfg-info -c
iovDisableIR=TRUE
备注:这就表示缺省没有启动;
也可以利用vSphere Client登录到服务器的GUI进行修改
30、虚拟机无法关闭停止在95%左右的解决办法
一次做虚拟机回收工作,由于目标虚拟机当时杀毒软件正在运行,CPU占用很高,本来想登陆关闭虚拟机,但是远程连接根本没反映,打开VC带的控制台,鼠标点击进去,操作也是在是慢,总归到底,最后,直接将虚拟机电源关闭。之后,就看着任务开始执行,但进度条走到95%的时候,咋都不动了。
解决思路:
这个问题,属于一个“沟通”问题,应该从两方面入手:
1、一个是vCenter端是否已经将此命令顺利传送到ESX;
2、然后是,ESXi/ESX端是否顺利接到命令,以及是否执行了此命令。
解决过程:
1、SSH连接ESX;
2、vmware-cmd &path.vmx& getstate 确定虚拟机状态;
&path.vmx& 为完全路径(空格等前别忘了加上转义符 /);vmware-cmd -l命令可查看虚拟机路
3、官方文档说若为On,可继续执行其他命令来结束虚拟机;
但是我走到这里,显示的为Off;这就说明,ESX已经将虚拟机关闭了,那这问题就是一个沟通问题
4、登陆VC,我想先从VC端将此问题虚拟机所在的主机断开连接,之后再重新连接,这样就会进行一次新的对话,但是,由于前一个未关闭虚拟机的任务未执行完毕,之后的任务好像都成队列似的在等待,没有反应。
5、任务无法执行,重启相关VC和ESX服务
VC:在Vitual Center的WIN机器上的,在服务管理器重启VC服务。
ESX:在SSH登陆后对两个服务器执行重启。(注:虚拟机服务会短暂中断)
命令如下:
service mgmt-vmware restart
service vmware-vpxa restart
6、在这沟通中的三个服务都已经重启完毕,此时再执行步骤2时,发现返回的结果为On–那台虚拟机正在运行,发现这个,那么按照官方的文档,后续的几个命令就可以有用武之地了。
7、kill -9 xxxx
ps -auxwww |grep -i &VMNAME&.vmx 可以看到虚拟机的PID
8、执行步骤2,现在已为Off
9、登陆VC查看,刷新下,如果状态还未改变,再重启下VC服务器,即可。
31、为主机应用Host Profiles提示compliance错误
故障状态:
为主机应用Host Profiles失败,提示如下错误:
01.Specification state absent from host: device ‘&datastore&’ state needs to be set to ‘on’
02.Host state doesn’t match specification: device ‘&datastore&’ needs to be reset
03.Specification state absent from host: device ‘&datastore&’ Path Selection Policy needs to be set to ‘VMW_PSP_FIXED’
04.Host state doesn’t match specification: device ‘&datastore&’ Path Selection Policy needs to be set to default for claiming SATP
故障分析:
这是由于PSA组件导致的;
解决方案:
1、右击Host Profiles后点击Enable/Disable Profiles配置选项;
2、展开“Storage Configuration”选项,展开“Pluggable Storage Architecture”这个uxanxiang;
3、去掉“PSA Device Configuration”;
4、展开“Native Muti-Pathing(NMP)”这个选项后,接着展开“PSP and SATP configuration for NMP devi”选项;
5、去掉“PSP configuration for”这个选项后点击OK即可。
33、分析、解决IOPS导致的虚拟机/存储性能下降和虚拟机磁盘延时较大的问题
故障状态:
1、虚拟机性能较低;
2、在执行备份时磁盘延时很厉害;
3、虚拟磁盘vmdk延时较大;
故障分析:
这种问题基本都是由于虚拟机没有足够的IO Per Second(IOPS),或者IOPS低于30;
解决方案:
在解决问题前,首先要解决以下两个问题:
问题1:什么是IOPS?
IOPS全称为Input/Output Per Second,它是衡量一个磁盘(虚拟磁盘和物理磁盘)、存储的基本也是十分重要的标准。不同的磁盘、存储有着不同的IOPS。IOPS的高低直接会影响着系统的性能。当前,VMware虚拟化环境中最大的瓶颈也就在于这个IOPS。针对数据密集型业务的数据库业务和流媒体业务,由于它们的IOPS很大,所以在虚拟化环境中部署它们一定要充分考量它们的负载,也就是IOPS大小,结合实际的存储性能来查看是否符合业务标准。
问题2:如何计算IOPS?
如何计算每台虚拟机的IOPS?
要想计算每个虚拟机的总的IOPS数量,首先就要确认磁盘类型以及它们的IOPS是多少。处于RAID阵列里面的每个盘的IO有利于增长整体存储的可用IOPS。而位于这个存储上面的单台虚拟机的IOPS,则可以通过将这个存储的总IOPS除掉虚拟机数量即可基本得到单台虚拟机的IOPS。
现实案例:
假定有6颗10000RPM的磁盘,那么它们的总的可用IOPS大约为150×6=900。如果LUN上面运行的虚拟机数量为50个,则单台虚拟机的IOPS为900/50=18 IOPS。如果以这个为标准,则意味着虚拟机的性能相对底下。如果想要满足虚拟机的基本IOPS需求,那么应该为900/30=30,也就是说同一个Volume里IOPS为30(最低要求)虚拟机需要数量控制在30台以下。
备注:备份存储会消耗更多的IOPS,同时也会给Volume带来更多额外的符合。如果是这样,则需要用额外手段解决备份时的额外资源消耗(可以通过I/O meter软件来测试IOPS)
34、丢失或锁定文档导致虚拟机无法Power On
故障状态:
1、虚拟机无法开启;
2、尝试开启虚拟机时,看到类似如下错误信息:
Unable to open Swap File;
Unable to access a file since it is locked;
Unable to access Virtual machine configuration;
3、在/var/log/vmkernel文件里可以看到类似如下信息:
WARNING: World: VM xxxx: xxx: Failed to open swap file &path&ock was not free
WARNING: World: VM xxxx: xxx: Failed to initialize swap file &path&
4、当尝试开启虚拟机的console控制台时,可能会收到如下错误信息:
Error connecting to &path&&virtual machine&.vmx because the VMX is not started
5、在开启虚拟机时,卡在95%位置无响应;
6、从模板部署一台新的VM之后无法开启虚拟机;
7、虚拟机在vCenter Server和ESXi/ESX主机之间报告控制台电源状态冲突;
故障分析:
导致这个问题的因素可能很多,但是众多问题中,都穿插或包含着文件损坏或文件被锁定等问题的可能。虚拟机常用的文件包括:
*-flat.vmdk
*-delta.vmdk
解决方案:
首先需要确认哪些文件处于锁定状态:
1、利用vSphere Client登录ESXi/ESX主机、vCenter Server主机;
2、在Datastore里找到想要开启但是无法开启的虚拟机所在位置;
3、尝试开启虚拟机,如果无法开启且console显示错误,先查阅vmware.log日志文件的相关信息来确认问题;
4、利用SSH或COS选用root权限登录到ESXi/ESX主机之后执行下面的命令查看虚拟机的完整路径:
#vmware-cmd -l
系统将输出类似如下信息来显示注册到ESXi/ESX主机的虚拟机:
/vmfs/volumes/&UUID&/&虚拟机目录&/&虚拟机名&.vmx
5、执行下列命令切入到这个虚拟机所在的目录:
#cd /vmfs/voluems/&UUID&/&虚拟机目录&
6、然后查阅vmware.log日志,在文件的尾部查看什么原因导致这个问题后再针对性的分析。
准确定位并删除掉锁定文件
由于虚拟机可以在主机之间移动,如果虚拟机注册到的主机保持对文件的锁定状态,那么,这个锁定文件可以有效保障ESXi/ESX主机对虚拟机文件的控制权和有效保护虚拟系统。主机由Service Console接口的MAC来确定。lock由VMkernel或Service Console负责维护;
备注:ESXi服务器没有Service Console所以,lock由VMkernel单独负责维护;
首先要确定VMkernel可能锁定的文件:
1、执行下面的命令来报告锁定目录所在的MAC地址:
#vmkfstools -D /vmfs/volumes/&UUID&/&虚拟机目录&/&锁定状态文件&
2、由于负责锁定.vmdk文件的主机会将MAC地址写入到vmkernel日志里面,那么可以用下面的命令查阅:
#tail /var/log/vmkernel
35、Storage vMotion失败:looking for lines staring with “CBTMotion”
故障状态:
1、执行Storage vMotion失败;
2、系统提示如下错误信息:
01.A general system error occurred: Storage VMotion failed to copy one or more of the VM’s disks. Please consult the VM’s log for more details, looking for lines starting with “CBTMotion-“.
复制代码3、/var/log/vmware/hostd.log文件里有类似如下信息:
01.Failed with error : Storage VMotion failed to copy one or more of the VM’s disks. Please consult the VM’s log for more details, looking for lines starting with “CBTMotion”.
复制代码故障分析
可能由于虚拟机的硬件版本号过老导致;
解决方案:
关掉虚拟机后右击uxniji选择Upgrade Virtual Machine Hardware即可。
36、添加LUN时提示HostDatastoreSystem.QueryVmfsDatastoreCreateOptions
故障状态:
系统能够扫描到Devices LUN,但是在添加过程中却提示如下错误信息:HostDatastoreSystem.QueryVmfsDatastoreCreateOptions ,如图所示:
故障分析:
这样的问题一般都是由于LUN的尺寸过大导致,一般来说,VMware ESXi/ESX Server标准支持最大的LUN尺寸为2TB-512Byte,但是由于国内很多技术人员对这个-512Byte并不太在意,所以习惯型的讲成2TB,这就导致很多用户在使用时,直接分配了2TB的空间,这就可能导致了上述问题;
解决方案:
针对这样的问题,建议如下:
1、如果已经分好了2TB的LUN,建议调整为1.88TB左右后再尝试添加;
2、新LUN规划用户则请严格参照官方文档的参数设计,建议是1.88TB左右为一个LUN生成Datastore
37、vCenter Converter推送Agent出错:Converter Agent installer/uninstaller Failed
故障状态:
1、利用vCenter Converter推送Agent到Windows Server 2003服务器上时,失败;
2、系统提示类是如下错误信息:
01.Converter Agent installer/uninstaller failed on ‘xxxxxxxxx’.
3、VMware vCenter Converter的日志文件converter-server.log里面有类似如下错误提示:
01.[#6] [ 10:50:55.976 04080 info ‘App’] [agentManager,83] [AgentManager] Install Agent on 192.168.10.10
02.[#6] [ 10:51:16.976 04080 error ‘App’] [agentManager,95] [AgentManager] Install Agent failed: converter.fault.AgentDeploymentFault
03.[#7] [ 11:18:37.289 03976 info ‘App’] Reusing existing VIM connection to 192.168.30.150
04.[#7] [ 11:18:37.476 03976 error ‘App’] Found dangling SSL error: [0] error::lib(0):func(0):reason(1)
05.[#7] [ 11:19:00.945 02756 info ‘App’] [agentManager,83] [AgentManager] Install Agent on 192.168.10.10
06.[#7] [ 11:19:21.961 02756 error ‘App’] [agentManager,95] [AgentManager] Install Agent failed: converter.fault.AgentDeploymentFault
7.[#7] [ 11:19:32.445 03976 info ‘App’] [diagnosticManager,357] Generating Converter.Server log bundle.
故障分析:
以下几种情况可能导致这样的问题:
1、445端口没能打开;
2、曾经手动安装过Agent后卸载;
3、Windows服务管理其中的server服务没有启动导致的IPC$连接失败;
4、防火墙阻绝;
1、确认445端口或NetBIOS协议能正常使用;
2、建议在Converter时关闭防火墙;
3、如果依然有问题,尝试用Converter Standardalone版本迁移或采用ConverterCD进行冷克隆。
38、解决在vSphere 5.0里开启HA时,提示:Datastore Heartbeating不足的问题
故障状态:
为ESXi 5.0+vCenter 5.0配置HA时,提示如下信息:
故障分析:
这是由于vSphere 5.0里的HA部分已经重写,并且新增了Datastore Heartbeating用于网络Partition心跳检测支持;
解决方案:
有2个选择,一个是加多存储用于心跳检测,这也是正确的选择,就不多讲,另一个就是忽略掉这个问题,方法如下:
1、vSphere Client登录到vCenter Server 5.0后,右击HA Cluster,点击Edit,然后找到高级选项设定:
2、再如上图所示的内容中,添加下参数:
das.ignoreinsufficienthbdatastore
备注:缺省情况下,这个参数的值是false的。
39、通过vSphere Client登陆ESXi主机提示“正在更新”的问题
故障状态:
通过vSphere Client登陆VCenter Server4.1正常,登陆ESXi主机提示如下图:
故障分析:
需要通过‘’来更新Client说明客户端存在问题,由于登陆VCenter Server4.1不存在任何问题,所以基本确定版本的问题。查看ESXi版本和vSphere Client,发现Client的版本低于ESXi版本。
解决方案:
由于Client所在网络无法上Internet,所以无法更新Client客户端,可以通过安装高版本的Client来解决此问题。
40、红旗32位Linux进入系统时提示”udevu”无法继续进入系统的问题
故障状态:进入系统后,出现下图的界面,之后无法向下运行,必须按Ctrl+C才能继续向下运行
故障分析:由于系统安装时候是完整的,光盘镜像包是完整的,安装的时候不存在任何问题。考虑到物理机上不存在这种问题,怀疑虚拟机虚拟驱动的问题,安装新的VMware-tools问题依旧。
解决方案:考虑到红旗Linux比较新,去官方下载11月份最新的VMware-tools,问题解决
(下载地址:/tools/esx)
50、虚拟机文件被锁,无法正常 power on
故障状态:
启动虚拟机时95%,停顿并且进程中断,提示:ubable to access files since it is locked。
解决方法:
1.首先将cluster中的HA功能关闭。如果该功能不关闭,容易造成死锁,,VM不断跳动,,不断再不同的ESX内循环被锁,徒劳而无功。
2.磁盘文件被锁,要解决,必须要知道到底是哪台ESX把他给锁住了,这是关键。
方法:看/var/log/vmkernel但是,在做这些前, 再准备些别的工作。
3.在VC中,把被锁的VM从Inventory中remove掉。原因很简单,这是一个 unregister的过程。
4.根据/var/log/vmkernel,搜索owner,可以找到类似以下的语句:
Oct 19 04:23:33 esx-hostname vmkernel: 3:06:29:47.992 cpu6:1656)FS3: 1975: Checking if lock
holders are live for lock [type 10c00001 offset
v 380, hb offset 3554304
Oct 19 04:23:33 esx-hostname vmkernel: gen 17, mode 1, owner
48f5f637-462688bc-fd28-0e1a mtime 38112]
OK,owner后面的48f5f637-462688bc-fd28-0e1a就是你的target了。 因为他就是锁住VM 的宿主.。
5.根据以下命令,,找出到底哪台ESX的UUID是 48f5f637-462688bc-fd28-0e1a
[root@esxhostname root]# esxcfg-info |grep -i ‘system uuid’
6.找到目标主机后,当然是杀死他锁住VM的进程。之所以会被锁,原因就是HA 把VM从别的HOST迁移过来,但是又没有unregister和register的过程,所以在第3步的时候,你查看VM的Summary的时候,host ip还是属于出问题的 host。 但是VM又被新的host霸王硬上功的power on,注册都没注册, 又怎么启动呢。找到 PID 用下面的命令:
ps -efwww|grep virtualmachine.vmx
找到 PID 后, kill -9 PID
7.这时候,还要确定一件事情, .vswp文件的事情。这个是给台客处理问题时吸取的经验。就因为忽略了这个,所以在杀掉迚程后,重新注册VM,还说没有 SWAP文件,启动还是失败。
在 VM 启动时会自动生成SWAP,没有SWAP文件,其实就是因为 SWAP 存在了, 因为重名而导致无法正常生成。
进入到/vmfs/volumes/lunid/vm_path/下,vmkfs -d virtual_machine.vswp
或者进入Datastore Browser,在里面把SWAP文件删除也可。
8.完全之策,你还可以进入到VM的SETTINGS–OPTIONS–SWAPFILE LOCATION, 对该保存的位置做下设置。
9.重新注册VM。进入Datastore Browser,找到VM.vmx,add to inventory。
10.启动 VM. Good Luck。
51、忽视掉ESXi/vCenter Server提示SSH事件的方法
1. vSphere Client连接到VC或者ESXi服务器;
2. 在Home -& Inventory -& Hosts and Clusters里展开选中你的ESX服务器;
3. 右边选择Configuration,然后点击Software栏目里的Advanced Settings;
4. 在Advanced Settings里选择左边列表中的UserVars;
5. 选中左边列表中的UserVars后,在右边拖到最下面,将UserVars.SuppressShellWarning的值改为1即可,不需要重启。
52、尝试迁移一台带USB设备的VM失败
故障状态:
在执行虚拟机迁移向导时,如果系统检测到不兼容的USB设备存在,则系统会提示如下错误信息:
Currently connecteddevice ‘USB 1’ uses backing ‘path:1/7/1’,which is not accessible.
故障分析:
这种问题通常发生在为主机开启了VMDirectPath I/O支持下的USB Passthrough Devices功能,然后为特定的VMs分配了USB设备,比如:加密狗;
解决方案:
1、确认USB设备能够被虚拟机识别和支持,并确保在添加USB设备到VMs时,勾选了with vMotion选项;
2、在执行vMotion动作之前,重新尝试将USB设备添加到VMs;
3、确认ESXi主机没被重启过,因为,ESXi主机重启之后,原本支持的vMotion WithvMotion功能将会失效。
53、Convert Linux系统的Troublshooting过程
(1)、确认源转换Linux机器的OS在官方的支持列表中;
(2)、拥有root权限;
(3)、确认DNS的设定有没有问题,注意:应该同时在Linux和Windows都加上;
(4)、确认源Linux能够ping同ESX或vCenter的IP。如果在2%时失败,最大的可能就是权限问题或防火墙阻隔问题;
(5)、确认Linux允许SSH登陆进去。这个,可以帮助我们在converting的时候登录到Linux系统;
(6)、确认是给helper virtual machine设定的静待IP,而不是DHCP获取的(如果网内没有DHCP服务器);
(7)、确认源和目标都在同一子网。如果通过路由链接的不同子网可能会出错;
(8)、注意,converter不支持做了软阵列的Linux系统。可以用冷克隆光盘来做,它会把软阵列的设定为/dev/md0。
(9)、VMware Converter Standalone的日志目录:C:Documents and SettingsAll UsersApplication DataVMwareVMware vCenter Converter Standalone,用于排错时用。
54、vCenter Service Status页面故障:Unable to retrieve health status
故障状态:
vCenter Server Status页面提示如下错误信息:
Unable to retrieve health status for vCenter inventory service
Unable to retrieve health status for VMware vSphere Profile-Driven storage service
执行vCenter Server的搜索动作时,提示如下错误提示:
Unable to connect to webservices to perform query.
Verify that the “VMware VirtualCenter Management WebServices” service running onhttps://&vcenter-host-name&:10443
故障分析:
这个问题一般都由于当vCenter Server服务发生了变更或全新安装了一台vCenter Server,但是数据库依然是原来的数据库导致;
解决方案:
替换掉vws.jar、jointool.jar和ds.jar文件即可,步骤如下:
下载本文附件中的vws.zip文件然后解压缩vws.jar、jointool.jar和ds.jar文件;
停止掉VirtualCenter Server服务以及VirtualCenter Management Webservices服务;拷贝vws.jar和jointool.jar到C:ProgramFilesVMwareInfrastructuretomcatwebappsWEB-INFlib覆盖掉原来的文件;拷贝ds.jar文件到C:Program FilesVMwareInfrastructureInventory Servicelib覆盖掉原来的文件;重新启动相关服务或vCenter Server服务器即可。
55、VMRC 控制台的连接已断开…正在尝试重新连接
故障状态:
用vSphere Client连接到ESXi 5.0的主机,启动其中的虚拟机后,无法连接控制台,打开控制台之后,窗口上方提示一行“VMRC 控制台的连接已断开…正在尝试重新连接。”
故障分析:
从情况看,类似于Windows系统的DEP策略处于开启状态导致的问题一样。但这个情况是所有虚拟机都提示这个错误,排错DEP的问题,用本地vSphere Client登录一个VC平台,问题仍旧一样。为了排除问题,换了一台笔记本登录VC,突然发现问题不见了。原来是本地的vSphere Client出了问题,再三思索,发现出现问题前我对本地WIN7用360安全卫士升级了补丁,是否是补丁破坏了vSphere Client某个文件呢
解决方案:
重现安装vSphere Client,问题解决。
56、端口 80 的 vCenter Server 和 IIS 之间的冲突
故障状态:
vCenter Server 和 Microsoft Internet Information Service (IIS) 都将端口 80 用作直接 HTTP 连接的默认端口。该冲突会导致安装 vSphere Authentication Proxy 后 vCenter Server 无法重新启动。 在 vSphere Authentication Proxy 安装完成后, vCenter Server 无法重新启动。
故障分析:
如果安装 vSphere Authentication Proxy 时未安装 IIS ,则安装程序会提示您安装 IIS 。因为 IIS 使用端口 80 ,这是用于 vCenter Server 直接 HTTP 连接的默认端口, 所以 vCenter Server 在 vSphere Authentication Proxy。安装完成后无法重新启动。请参见第 32 页,“ vCenter Server 所需的端口” 。
解决方案:
要为端口 80 解决 IIS 和 vCenter Server 之间的冲突,请执行以下操作之一。
如果在安装 vCenter Server 之前已安装 IIS 将 vCenter Server 直接 HTTP 连接的端口由 80 更改为其他值。 如果在安装 IIS 之前已安装 vCenter
Server 重新启动 vCenter Server 之前, 将 IIS 默认网站的绑定端口由 80 更改为其他。
57、在 UEFI 模式下安装 ESXi 后主机无法引导
故障状态:
在 UEFI 模式下, 在主机上安装 ESXi 后重新引导时, 重新引导可能失败。 出现此问题的同时, 还显示一条类似于以下内容的错误消息: 发生异常网络错误。无可用的引导设备 (Unexpected network error. No boot device available)。
故障分析:
主机系统无法识别作为引导磁盘在其上安装 ESXi 的磁盘。
解决方案:
1 屏幕上显示错误消息时,按 F11 显示引导选项。
2 选择一个类似于添加引导选项的选项。该选项的文字可能有所不同,具体取决于您的系统。
3 在安装 ESXi 的磁盘上选择文件 EFIBOOTBOOTx64.EFI 。
4 更改引导顺序,以便主机从添加的选项引导。
58、将 Microsoft SQL 数据库设置为不受支持的兼容模式会导致 vCenter Server 安装或升级失败
当数据库设置为不支持的版本的兼容性模式时,使用 Microsoft SQL 数据库的 vCenter Server 安装会失败。
将显示以下错误消息: 输入的数据库用户没有使用选定数据库安装和配置 vCenter Server 所需的必要权限。 请更正以下错误 : %s
故障分析:
数据库版本必须是 vCenter Server 支持的版本。 对于 SQL , 即使数据库是受支持的版本, 但如果将其设置为以不支持的版本的兼容性模式运行, 仍会发生此错误。 例如, 如果将 SQL 2008 设置为以 SQL 2000 兼容性模式运
行,就会发生此错误。
解决方案:
u 请确保 vCenter Server 数据库是受支持的版本, 并且没有设置为以不支持的版本的兼容性模式运行。
59、误删运行中的虚拟机,通过xx-flat.vmdk恢复方法
故障状态:误删了运行中的虚拟机,进入目录查看,只剩下xx-flat.vmdk文件,从文件的类型看,只是File格式,不是Virtual Disk格式,新建虚拟,选择添加已存在磁盘,提示不存在
解决方案:
1. 新建一虚拟机,不要创建硬盘
2. 用ssh的方式登录host,查找xx-flat.vmdk文件所在位置及目录,
3. 在上面这个文件相同目录下创建新xxx.vmdk文件,大小要和xx-flat.vmdk文件一样大,
用ls -la查看xx-flat.vmdk文件大小,
用vmkfstools -c 文件大小 -a lsilogic xxx.vmdk 来创建新磁盘文件
4. 将这个磁盘文件添加到新建的虚拟机中;
5. 用原文件xx-flat.vmdk覆盖新建的xxx-flat.vmdk(注意一定是-flat.vmdk),使用mv命令
6. 完成后开启虚拟机就可以了
60、在view桌面中,Win7下安装出现软件出现“系统管理员设置了系统策略,禁止进行此安装”的提示
解决方案:
1、打开“开始-&控制面板-&管理工具-&本地安全策略”-&点击“软件限制策略”,如果提示“没有定义软件限制策略”,那么就右键“创建软件限制策略”-&创建后,双击右侧“强制”,选择“除本地管理员以外的所有用户”,确定
2、windows开始菜单,运行里面输入gpedit.msc打开组策略,
在“计算机配置”→管理模板→windows组件→windows installer,右边 第一项就是禁用windows installer。把它改成 “未配置”后者“已禁用”就可以了。
3、删除HKEY_CLASSES_ROOTInstallerProducts3D11C8EFC注册表项目。(建议使用此法,能解决大多数你出现的情况,在运行栏里输入regedit进入注册表,按照以上路径找到项目删除就可以了)
61、持续较高的 CPU 使用情况的解决方案
CPU 使用情况中的临时高峰表示 CPU 资源的使用情况最佳。持续较高的 CPU 使用情况可能表示存在问题。 您可以使用 vSphere Client CPU 性能图表监控主机、群集、资源池、虚拟机和 vApp 的 CPU 使用情况。
问题 n 主机 CPU 使用情况一直很高。 CPU 使用情况值较高时会增加主机上虚拟机的就绪时间和处理器列队。
n 虚拟机 CPU 使用情况超过 90% ,且 CPU 就绪值超过 20% 。应用程序性能将受到影响。
主机可能缺少满足要求所需的 CPU 资源。
解决方案: n 验证是否在主机的每台虚拟机上均安装了 VMware Tools 。
n 将主机上或资源池中其他虚拟机的 CPU 使用情况与此虚拟机的 CPU 使用情况值进行比较。 主机的虚拟机 视图上的堆栈条形图显示主机上所有虚拟机的 CPU 使用情况。 n 确定虚拟机就绪时间过长是否由其 CPU 使用情况时间达到 CPU 限制设置所致。 如果出现这种情况, 请增
加虚拟机上的 CPU 限制。 n 增加 CPU 份额以给予虚拟机更多机会运行。 如果主机系统受到 CPU 约束, 则主机上的总就绪时间可能仍 维持在相同级别。如果主机就绪时间没有减少,则为高优先级虚拟机设置 CPU 预留,保证它们收到所需 要的 CPU 周期。 n 增加分配给虚拟机的内存量。此操作会减少所缓存应用程序的磁盘和 / 或网络活动。这可能会降低磁盘
I/O ,并减少主机对虚拟化硬件的需求。具有较少资源分配的虚拟机通常可累积更多的 CPU 就绪时间。 n 将虚拟机上的虚拟 CPU 数量减少到执行工作负载所需要的数量。例如,四路虚拟机上的单线程应用程序
只能从单个 vCPU 中受益。 而管理程序还需维护三个空闲 vCPU , 占用本可用来处理其他工作的 CPU 周期。 n 如果主机不在 DRS 群集中,则将它添加到一个群集中。如果主机在 DRS 群集中,则增加主机数,并将一 个或多个虚拟机迁移到新主机上。 n 如有必要,请在主机上升级物理 CPU 或内核。
n 使用最新版本的管理程序软件并启用 CPU 节省功能(例如 TCP 分段卸载、较大内存页面和巨型帧)。
63、vMotion虚拟机失败:A general system error occurred:Failed to flush checkpoint
1、尝试vMotion一台虚拟机失败,提示如下错误信息:
A general system error occurred:Failed to flush checkpointt data!
2、此时故障虚拟机的设定如下:
分辨率大于 24或小于第二个屏幕的分辨率;
显卡驱动选用了WDDM;
虚拟机的硬件版本号为8;
3、vCenter的Task & Events里的详细错误描述如下:
An I/O error occurred while saving the checkpont:0(Resource temporarily unavailable);
Failed to write checkpoint data(offset xxxxxxxx,size xxxxx):Failed to resum VM;
4、在虚拟机的vmware.log日志文件里有类似如下信息:
.vmx| MigrateSetState: Transitioning from state 9 to 11.
.vmx| Migrate_SetFailure: Failed waiting for data. Error bad0006. Limit exceeded.
.vmx| Migrate: cleaning up migration state.
.vmx| MigrateSetState: Transitioning from state 11 to 0.
.vmx| Msg_Post: Error
.vmx| [vob.vmotion.chkpt.toobig] vMotion migration [XXXXXXXX:xxxxxxxxxxxxxxxx] failed. The checkpoint data length (xxxxx bytes) or the offset (xxxxxxxx bytes) exceeds the maximum checkpoint data length (xxxxxxxx byte).
.vmx| [msg.moduletable.powerOnFailed] Module Migrate power on failed. 故障分析:
这种情况可能是由于虚拟机的硬件版本号为8,WDDM驱动以及虚拟机的显存等问题导致;
由于问题可能不是由于单一原因导致,因此,可根据如下方式分别进行故障排查处理:
1、将屏幕的分辨率调整一下,小于24或和第二块屏幕的分辨率相等;
2、不要将虚拟机的硬件版本号升级为8;
3、增加checkpoint cache size,将它从8MB升级到16MB,方法如下:
关闭虚拟机后右击虚拟机点击Edit Settings;
在弹出的对话框中找到Options页标签后选择Advanced选项,在General下选择Configuration Parameters;
点击Add Row后输入如下参数:migrate.baseCptCacheSize值设定为后点击Ok应用更改;
4、将mks.enable3d的值设定为TRUE,步骤如下:
关闭虚拟机后右击虚拟机点击Edit Settings;
在弹出的对话框中找到Options页标签后选择Advanced选项,在General下选择 Configuration Parameters;
点击Add Row后输入,将值设定为True后点击Ok保存关闭。
64、迁移完成vCenter Server数据库到新主机后,VirtualCenter Management WebServices不对
1、vCenter Server数据库迁移到一个拥有新主机名和IP地址的系统上时,VirtualCenter Management WebServices服务异常;
2、vSphere Client登录服务器时,看到Performance Overview Charts报错如下:
General report generation exception
Perf Charts service experienced an internal error.
Message: Report application initialization is not completed successfully. Retry in 60 seconds.
3、vSphere Client登录到vCenter Server后搜索之类的功能都无法使用;
4、vCenter Service Status显示VirtualCenter WebServices和很多其它服务都处于离线状态, 报如下错误信息:
Unable to retrieve health data from https://localhost:8443
Service initialization failed.
当vCenter Server的数据库被迁移到新位置后,必须要更改DSN的信息,然而,Tomcat Server的设定却不会随之变化,因此,我们需要对Tomcat Server进行修改之后才能正常,Tomcat Server被用于支持VirtualCenter Management Webservices服务运行;
解决方案就是进入到Tomcat Server的配置文件里,找到database_name.propeties,通常位置如下:
W2K3 – C:Documents and UsersAll UsersApplication DataVMwareVMware VirtualCenter
W2K8 – C:ProgramDataVMwareVMware VirtualCenter
修改Tomcat Server的数据库位置方法如下:
1、文本文件打开database_name.properties,找到如下内容:
url=jdbc:sqlserver:/DB_hostname\DB_databaseName=database_integratedSecurity=true
2、修改上述文档中对应位置的数据库的对应主机名或IP地址;
3、重启VMware VirtualCenter Management Webservices服务或重启vCenter Server服务器后,理论上即可恢复正常。
65、在ESXi 5.0里,无法将管理网路迁移到vDS
故障状态:
1、无法将管理网路迁移到ESXi 5.0所在的vDS上,提示如下错误信息:
A specified parameter was not correct
2、vCenter Server上有类似如下的错误消息:
Call “HostNetworkSystem.UpdateNetworkConfig” for object “networkSystem-121” on vCenter Server “vCenter in vmanager.local” failed.
3、在hostd.log日志文件里,可以看到类似如下的日志信息:
T15:54:09.649Z [FFE92A90 error ‘NetworkProvider’ opID=DA1DFDC2-] Unknown port type [0]: convert to UNKNOWN.
T15:54:09.721Z [FFE92A90 info ‘NetworkVmkSimulator’ opID=DA1DFDC2-] Portgroup Management Network has 1 client[s] connected to it
T15:54:09.721Z [FFE92A90 info ‘HostsvcPlugin’ opID=DA1DFDC2-] Simulate failed
故障分析:
这个问题一般都是由于网路的coredump功能有问题导致的; 解决方案:
确认这个coredump功能处于enabled状态,方法如下:
#esxcli system coredump network get
Enabled: true
Host VNic: vmk0
Network Server IP: XXX.XXX.XXX.XXX
Network Server Port: 6500
也可以利用esxcfg-vswitch -l的输出结果来确认:
PortGroup Name VLAN ID Used Ports Uplinks
Management Network 10 2 vmnic0
例如,如果要在上述的网路卡上关闭coredump的话,可以执行如下命令:
#esxcli system coredump network set –enable false
66、克隆虚拟机失败:Invalid configuration for device 
1、无法克隆虚拟机,克隆是出错:
Failed to clone a VM,error:Invalid configuration for device 
2、克隆到99%时失败;
这种问题可能是由于UTC时钟不同步的缘故;
1、vSphere Client连接到vCenter Server,点击Configuration页标签;
2、点击Software面板下的Time Configuration选项,点击Properties;
3、确认时间是否有问题,如果有问题,做好时间同步:
点击Software面板 -& NTP Configuration -& Options -& NTP Settings;
4、OK,重启下服务。
67、如何生成ESXi的新证书
通常,只有当更改主机名称或意外删除证书时,才要生成新证书。在某些情况下,可能需要强制主机生成新的证书。 a、登录 ESXi Shell 并获取 root 特权。 b、在 /etc/vmware/ssl 目录中,备份现有证书,方法是使用以下命令对其进行重命名。 mv rui.crt orig.rui.crt mv rui.key orig.rui.key
注意 如果由于删除了证书而需要重新生成这些证书,则不必执行此步骤。 c、运行命令 /sbin/generate-certificates 生成新的证书。 d、运行命令 /etc/init.d/hostd restart 重新启动 hostd 进程。 e、通过执行以下命令并将新证书文件的时间戳与 orig.rui.crt 和 orig.rui.key 进行比较,来确认主机是否已成功生成新证书。
68、如何删除vCenter中无用的插件
69、冷迁虚拟机到ESXi主机后,它会自动迁移到另一台ESXi主机上
故障状态: 冷迁虚拟机虚拟机到一台ESXi主机后,Power On时它自动跑到另一台ESXi主机上了; 故障分析: 这个事情,其实不算事情,只是由于DRS的Automation级别选定了Fully Automated导致; 解决方案: 1、点击指定的虚拟机的Tasks and Events页标签; 2、点击Events,里面可以看到:DRS migrated xxxx from hostxx to host xxx; 3、找到DRS Cluster,右击Edit Settings,在DRS Settings下点击Virtual Machine Options; 4、更改自动化级别为Disabled或Manual,即可。
70、清除vSphere Client的登录记录
使用vSphere Client连接多了,下拉列表里有很多的历史记录,看着有点烦.
搜索了下,找到了E文的操作办法
定位注册表到
HKEY_CURRENT_USERSoftwareVMwareVMware Infrastructure ClientPreferences
RecentConnections 的记录即可
71、Linux系统VMXNET3虚拟网路卡时UDP包被Drop掉
ESXi 5.x系统上的Linux虚拟机,虚拟网路卡选择为VMXNET3时,UDP包被Drop掉了;
这是一个技术bug,VMware正在着手解决;
作为变通手段,只需要将VMXNET3改为E1000这个虚拟网路卡类型即可。
72、恢复孤立的虚拟机
故障状态:
虚拟机显示在 vSphere Client 清单列表中,其中 (orphaned) 附加到其名称。
故障分析:
在极少数情况下,位于由 vCenter Server 管理的 ESXi 主机上的虚拟机可能会变为孤立状态。 vCenter Server 数据库中存在这些虚拟机,但 ESXi 主机不再能识别出它们。 故障原因:
如果主机故障切换失败,或直接在主机上取消对虚拟机的注册时,虚拟机可能会变为孤立状态。如果发生这种情况, 请将孤立的虚拟机移动到数据中心( 该数据中心可访问其中存储着虚拟机文件的数据存储) 中的其他主机。
解决方案:
1 在 vSphere Client 清单列表中,右键单击虚拟机,然后选择重定位。此时将显示可用主机列表。
2 选择要在其中放置虚拟机的主机。如果没有可用主机,请添加可访问其中存储着虚拟机文件的数据存储的主机。
3 单击确定保存更改。虚拟机已连接到新的主机,并显示在清单列表中。
73、从模板克隆或部署后未打开虚拟机电源
故障状态:
当从模板中克隆或部署虚拟机时,可以在“即将完成”页面上选中创建后打开此虚拟机电源复选框。但虚拟机在创建后可能不会自动打开电源。
故障分析:
创建虚拟机磁盘时,未预留交换文件大小。
n 减小虚拟机所需的交换文件的大小。可以通过增加虚拟机内存预留空间来实现。
a 在 vSphere Client 清单中,右键单击虚拟机并选择编辑设置。
b 选择资源选项卡,然后单击内存。
c 使用“预留”滑块增加分配给虚拟机的内存量。
d 单击确定。 |
n 或者,可以通过将其他虚拟机磁盘从交换文件正在使用的数据存储中移出来增加交换文件的可用空间量。
a 在 vSphere Client 清单中,选择一个数据存储,然后单击虚拟机选项卡。
b 对于每个要移动的虚拟机,右键单击虚拟机,然后选择迁移。
c 选择更改数据存储。
d 继续完成迁移虚拟机向导。
n 另外,可以通过将交换文件位置更改为具有足够空间的数据存储来增加交换文件的可用空间量。
a 在 vSphere Client 清单中,选择主机,然后单击配置选项卡。
b 在“软件”下,选择虚拟机交换文件位置。
c 单击编辑。
注意 如果主机属于指定虚拟机交换文件与虚拟机存储在同一目录的群集,则无法单击 编辑。您必须使用“群集设置”对话框更改群集的交换文件位置策略。
d 从列表中选择数据存储,然后单击确定。
74、通过NAT连接的vCenter和ESXi主机每隔30~60秒左右自动断开
通过NAT地址转换后的vCenter和ESXi主机之间的通信每30~60秒左右会中断;
这个问题一般都是由于在vCenter和ESXi主机之间无法通过NAT进行正常通信导致;
导致上述问题的原因是UDP 902端口适用于心跳的,而这个端口打开之后,2008服务器的防火墙可能会锁掉Edge Traversal,因此需要激活Allow Edge Traversal选项,步骤如下:
1、进入到2008系统的管理工具面板里;
2、点击Windows Firewall with Advanced Security后点击Inbound Rules;
3、找到VMware vCenter Server – Host heartbeat规则,点击Advanced页标签;
4、点击Allow Edge Traversal选项后,点击OK;
5、然后重启相关服务后重新删除/添加ESXi主机到vCenter Server即可。
75、为虚拟机添加PCI设备
步骤如下:
1、利用vSphere Client登录系统之后,找到要添加PCI设备的虚拟机;
2、右击Virtual Machine-&Edit Settings;
3、在Hardware页标签点击Add;
4、选择PCI Device然后点击Next进入下一步,悬着passthrough设备,然后点击Next进入下一步;
5、如果确认没啥问题则点击Finish完成。
76、数据库sa密码变更后修改vCenter Server的sa访问密码方法
出于安全等方面考虑,SQL数据库的sa密码发生了变更,那么,这时它关联的vCenter Server这边也应该相应调整,那么,不重装就可以调整的方式如下:
1、管理员权限登录到vCenter Server所在Windows 操作系统;
2、进入入到如下目录:C:Program FilesVMwareInfrastructureVirtualCenter Server,执行如下命令:
vpxd -P &new_Password&
3、重启VirtualCenter Server services相关服务即可。
77、“虚拟设备的数目超过给定控制器的最大值”的错误
克隆虚拟机的时候出现如下的报错:
“虚拟设备的数目超过给定控制器的最大值”
这个问题一般都是由于在克隆虚拟机的时候,对源虚拟机做了虚拟硬件的操作导致
解决方案:
重新克隆虚拟机,在克隆的时候不要对源虚拟机进行虚假硬件的操作。
78、vCenter Operations Manager 5.0自动锁定了admin账户的解决方案
密码重试次数过多,导致了admin账户被锁定,无法再登录,解决思路如下:
解决方案:
首先,确认admin账户是否真的被锁定:
1、用root账户登录,然后执行如下命令:
如果该账户被锁定,则系统将会显示类似如下信息:
Account locked due to XX failed login….
2、然后再在Analytics虚拟机上重复上述步骤;
当确认admin账户被锁定后,解除锁定步骤如下:
1、root账户登录,然后执行如下命令:
pam_tally –user admin –reset
2、再在Analytics虚拟机上重复这个步骤即可。
如果想要一劳永逸的禁止掉自动锁定账户的功能则可以参考如下步骤:
1、root账户登录,然后执行如下命令:
/etc/pam.d/common-auth:auth requisite pam_tally.so deny=3
2、再在Analytics虚拟机上重复上述步骤即可。
79、 解决由于esx.conf文件锁定导致ESXi从vCenter Server断开连接的问题
1、ESXi 5.0主机莫名其妙无响应从vCenter Server断开;
2、SSH或DCUI登录ESXi主机失败;
3、vmkernel.log文件里没有任何问题,执行esxtop命令是可以看到CPU消耗率为100%;
4、在hostd.log日志文件里有类似如下信息:
T10:10:32.170Q [2D2D7B90 verbose ‘ThreadPool’] usage : total=19 max=62 workrun=18
iorun=1 workQ=933 ioQ=0 maxrun=24 maxQ=934 cur=I
T19:17:25.641Z [2CA47B90 verbose
‘ThreadPool’] usage : total=20 max=62 workrun=18 iorun=2 workQ=933 ioQ=0 maxrun=24 maxQ=934 cur=I
T10:10:32.442Q [2CA47B90 verbose ‘SoapAdapter’] Responded to service state request
这个问题可能由于esx.conf文件被锁定导致;
解除esx.conf文件的锁定状态,方法如下:
1、登录到ESXi主机的本地命令行界面后执行如下命令:
1. #ls -l /etc/vmware/esx.conf.LOCK
2、执行如下命令删除掉该文件:
1. #rm /etc/vmware/esx.conf.LOCK
3、执行如下命令重启管理服务:
1. $/sbin/services.sh restart
80、配置 Qlogic BIOS 实现 Boot from SAN
如果需要将ESXi/ESX服务器配置为Qlogic BIOS实现SAN Boot,有很几个地方需要配置。 首先需要激活 HBA BIOS,然后设定和激活选定的、用于启动ESX的LUN,具体步骤如下:
1 、启动服务器时,按 Ctrl + Q 组合键进入到 Fast!UTIL 配置界面;
2 、进入之后执行下列步骤:
o 如果只有一块 HBA 卡, 则它会自动被选定,同时 Fast!UTIL 选项会出现;
o 如果有多块 HBA 卡,则需要手动炫动需要设置的对象, 在 Select Host Adapter 屏幕上上下移动选
定需要设置的 HBA 卡后回车;
备注: SAN BOOT 建议尽可能使用较小的 HBA 卡 LUN 序号;
3 、 在 Fast!UTIL Options 界面选择 Configuration Settings 后回车;
4 、在 Configratoin Settings 界面选择 Host Adapter Settings 后回车;
5 、在 Host Adapter Settings 界面选择 Host Adapter BIOS 后回车, 将值调整为 Enabled 模式, 这意味着为 HBA 卡激活 BIOS ;
6 、按 ESC 退出, 然后选择 Selectable Boot Settings 后回车;
7 、在 Selectable Boot Settings 界面,选择 Selectable Boot 后回车将值调整为 Enabled ;
8 、选择在列表的中 Storage Processor ,选定第一个后回车打开 Select Fibre Channel Device 界面;
9 、选择一个 Storage Processor ( SP ) 后回车;
备注: SAN BOOT 要求 SP 后面的 LUN 的 Target ID 尽可能小。 同时需要确认 SP 和 LUN 能够最快被扫描到 .wwpn 顺序不一定对应 Target ID 顺序。如果存储阵列处于 Active/Passive 模式, 则选择的 SP 必须为 Active 路径所在的 LUN 。 如果无法确认那个 SP 的 Target ID 更小, 则可以用存储管理软件确认一下;
10a 、如果 SP 后只挂了一个 LUN 则它将会自动成为 BOOT LUN ,因此不用再进入到下一步;
10b 、如果 SP 后跟了 2 个以上的 LUN , 则需要在 Select LUN 界面里选择一个用于 SAN BOOT 后回车;
11 、 如果在清单里还有其它存储适配器, 则按 C 按钮清除掉然后 ESC 二次后回车保存设定, 完成设定。
81、Windows 7虚拟机无法通过RDP访问单可以用vSphere Client访问
无法通过RDP连接到Win7但是,可以通过vSphere Client连进去,通过Console查阅;
这个问题一般都是由于Win7的休眠组件导致;
更改电源状态设定,步骤如下:
1、打开虚拟机,进入到里面,找到控制面板,然后点Power Options选项;
2、点击Change when the computer sleeps,然后将Turn Off the display选项设为Never之后将Put the computer to sleep选项设为Never即可。
82、解决vSphere Client登录linux版vCenter失败:cannot complete login due to an inc…
学生在做试验时,用vSphere Client结合普通的AD User登录到系统提示如下错误信息:
cannot complete login due to an incorrect user name or password
这种问题,仅仅在选用Linux版本的vCenter时才会出现,Windows版本的问题不会出现这个问题,是由于过多的错误登录导致vCenter Server锁掉了这个账户;
1、root权限登录到Linux版本vCenter服务器;
2、在系统下执行如下命令:
/sbin/pam_tally –user user01@vmanager –reset
83、如何解决系统提示红色警报但Alarms & Events里看不到任何信息
系统提示红色感叹号的报警,可是在Alarms & Events里看不到任何问题
1、vSphere Client登录到vCenter Server,点击Hosts And Clusters选项;
2、点击Alarms页标签后点击Definitions.Note,选择所有的Alarms,点击Remove;
利用PowerCLI命令来完成,这就简单多啰:
Get-AlarmDefinition | %{$_.ExtensionData.RemoveAlarm()}
初始化vCenter Server Alarms,步骤如下:
1、vSphere Client登录到vCenter Server然后点击Administration -& vCenter Server Settings;
2、点击Advanced Settings,将alarm.version的值设为0;
3、将alarms.upgraded的值设为false,然后重启VMware VirtualCenter Server服务。
84、利用Web Client登录vCenter失败:unable to connect to vCenter Inventory Service
从vCenter Server 4.1升级到5.0后,遇到如下类型的错误:
1、无法利用Web Client登录到到vCenter,系统提示如下错误信息:
unable to connect to vCenter Inventory Service – https://xxxx:10443
2、好不容易登陆上去之后,vCenter Server里的Health Status不显示任何错误但是无法访问;
3、在C:ProgramDataVMwareInstrastructureInventory ServiceLogs目录下的ds.log文件下有类似如下错误:
Error connecting to peer:https://xxxx:10443 reason:
org.apache.http.conn.HttpHostConnectException:Connection to https://xxxx:10443 refused.
这个问题一般都由于vCenter Inventory数据库导致;
更新vCenter Inventory数据库,步骤如下:
1、进入到Windows服务管理器找到vCenter Inventory Service服务,右击,选择Stop;
2、进入到命令行界面,删除掉所有Inventory Service目录下的相关数据,缺省位置:
C:Program FilesVMwareInfrastructureInventory Servicedata.
3、进入到如下目录:C:Program FilesVMwareInfrastructureInventory Servicescripts;
4、执行如下命令重置vCenter Inventory Service数据库:
、在服务管理器里重启vCenter Inventory Service即可解决这个问题。
85、更改vSphere 5中虚拟机的快照delta文件位置
默认情况下,快照产生的delta文件都是和虚拟机的工作目录放在一起的,有时候,我们出于性能和空间等多方面的因素考虑,不希望两者同在,因此,可以通过如下步骤自行调整delta文件的位置:
1、关闭虚拟机后右击虚拟机点击Edit Settings;
2、点击Options页标签然后在Advanced Options选项里点击General按钮;
3、点击Configuration Parameters,点击Add Row;
4、在Name栏输入snapshot.redoNotWithParent,在Value栏输入true;
5、此时,重新开机即可。
备注:在快照管理中workingDir是一个比较重要的参数,在5.0以前,这个参数决定了所有快照文件的工作目录,缺省是虚拟机的当前目录,而在5.0以后虽然这个workingDir依然存在,不过,它只能决定*.vmsn的文件存放点,其它的文件可以通过我们上面的snapshot.redoNotWithParent参数来在*.vmx文件里指定。
86、安装vCenter Server 5.0失败:JDBC connectivity to the database using the gener…
1、无法安装vCenter Server 5.0;
2、安装失败后系统提示如下错误:
JDBC connectivity to the database using the generated JDBC URL failed.Please enter the URL to ensure that it connects to the desired database.
3、在VIMTOOL.Log文件里有类似如下错误信息INFO] Invoking testdbprops “C:Userswpvb1AppDataLocalTemp2{1FBCB62E-F-ADE2-D4}VM4273.tmp”Testing DB connection from C:Userswpvb1AppDataLocalTemp2{1FBCB62E-F-ADE2-D4}VM4273.tmp: [ 11:12:50 INFO] Config name=dummy
INFO] Property file=null
INFO] Loaded url from props=&not set&
INFO] Overrides=
prop:dbtype
prop:password
prop:password.encrypted
prop:driver
prop:username
Error: The TCP/IP connection to the host VMhost, port 1433 has failed. Error: “Connection refused: connect. Verify the connection properties, check that an instance of SQL Server is running on the host and accepting TCP/IP connections at the port, and that no firewall is blocking TCP connections to the port.”.
[ 11:13:05 SEVERE] Error in invocation of testdbprops
com.microsoft.sqlserver.jdbc.SQLServerException: The TCP/IP connection to the host VMhost, port 1433 has failed. Error: “Connection refused: connect. Verify the connection properties, check that an instance of SQL Server is running on the host and accepting TCP/IP connections at the port, and that no firewall is blocking TCP connections to the port.”.
at com.microsoft.sqlserver.jdbc.SQLServerException.makeFromDriverError(SQLServerException.java:170)
at com.microsoft.sqlserver.jdbc.SQLServerConnection.connectHelper(SQLServerConnection.java:1049)
at com.microsoft.sqlserver.jdbc.SQLServerConnection.login(SQLServerConnection.java:833)
at com.microsoft.sqlserver.jdbc.SQLServerConnection.connect(SQLServerConnection.java:716)
at com.microsoft.sqlserver.jdbc.SQLServerDriver.connect(SQLServerDriver.java:841)
at java.sql.DriverManager.getConnection(DriverManager.java:582)
at java.sql.DriverManager.getConnection(DriverManager.java:185)
at com.mon.vdb.VdbDataSource.getConnection(VdbDataSource.java:84)
at com.vmware.vim.vimtool.dbprops.TestDbProperties.testConnection(TestDbProperties.java:70)
at com.vmware.vim.vimtool.dbprops.TestDbProperties.invoke(TestDbProperties.java:53)
at com.vmware.vim.vimtool.VimTool.invokeTool(VimTool.java:156)
at com.vmware.vim.vimtool.VimTool.main(VimTool.java:94)
Error in invocation of testdbprops: com.microsoft.sqlserver.jdbc.SQLServerException: The TCP/IP connection to the host VMhost, port 1433 has failed. Error: “Connection refused: connect. Verify the connection properties, check that an instance of SQL Server is running on the host and accepting TCP/IP connections at the port, and that no firewall is blocking TCP connections to the port.”.
主要发生在SQL服务器的缺省端口不是1443导致的;
安装vCenter Server的过程中会生成和验证JDBC URL,由于缺省走的是1443端口,当变更了端口之后,安装时,就可以输入正确的JDBC地址,例如:
jdbc:sqlserver://xxxx:databaseName=vcdb
如果选用的是Local Express版本的DB时,则采用如下配置:
jdbc:sqlserver://localhost\SQLEXP_VIM;databaseName=VIM_VCDB;integratedSecurity=true
87、 启动RHEL Linux虚拟机提示:Cannot setup NMI watchdog on CPU
启动RHEL的Linux虚拟机时,Console提示如下信息:
Cannot setup NMI watchdog on CPU 0
Cannot setup NMI watchdog on CPU 1
Cannot setup NMI watchdog on CPU 2
Cannot setup NMI watchdog on CPU 3
主要时部分Linux操作系统却升级活了支持Non Maskable Interrupt(NMI),而它会依赖硬件watchdog服务来监控系统是否由于硬件故障导致的异常;
不是所有硬件都支持NMI的,因此,当虚拟机选择最新的8和7这个虚拟机硬件版本时,容易出现这个问题;
关闭掉这个Non Maskable Interrupt(NMI)功能,步骤如下:
1、进入到这台Linux虚拟机的命令行界面,然后运行如下命令:
#vi /boot/grub/menu.lst
2、在打开的文件里,更改nmi_watchdog的值,从1改为0,例如:
t itle Red Hat Enterprise Linux Server (2.6.18-128.el5)
root (hd0,0)
kernel /vmlinuz-2.6.18-128.el5 ro root=/dev/sda nmi_watchdog=0
initrd /ini}

我要回帖

更多关于 iscsi sanboot 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信