第一篇:簡歷(運維工程師-吳曉-智聯(lián))2
個 人 簡 歷
基本信息:
姓名:吳曉性別:男出生日期:1987-10-27
身高:172cm戶口所在地:湖南長沙現(xiàn)住址:廣州 聯(lián)系方式:***電子郵件:wx22765652@126.com
專業(yè)證書:
RHCE紅帽認證工程師、大學(xué)英語四級
培訓(xùn)與工作經(jīng)歷:
2009.11-2010.5 在藍狐網(wǎng)絡(luò)培訓(xùn)學(xué)校培訓(xùn)網(wǎng)絡(luò)
-----------------2010.6-2011.5 在上海艾泰科技有限公司,任網(wǎng)絡(luò)客服工程師,在職期間因為表現(xiàn)突出被提前轉(zhuǎn)正,并且在工作期間業(yè)務(wù)能力突出。
-----------------2011.6-2012.3 在藍狐網(wǎng)絡(luò)培訓(xùn)學(xué)校培訓(xùn)linux服務(wù)器
業(yè)務(wù)能力:
服務(wù):
1、linux操作系統(tǒng)核心高級設(shè)置和性能調(diào)優(yōu);
2、Linux下的各種服務(wù)的維護和搭建,成功搭建了NFS,FTP,Samba網(wǎng)絡(luò)共享服務(wù)和apache、http、nginx等web服務(wù)器以及postfix、dovecot郵件服務(wù)器;
3、linux下的負載均衡技術(shù),并且運用heartbeat實現(xiàn)了http網(wǎng)站的負載均衡,確保網(wǎng)站高效穩(wěn)定的運行;
4、使用kickstart腳本全自動安裝Linux系統(tǒng),并且具有Linux下的獨立排錯能力,5、紅帽虛擬化技術(shù)的實現(xiàn),成功使用KEN的虛擬化和KVM虛擬化創(chuàng)建Linux虛擬機搭建服務(wù);
6、對CDN的安裝與配置有一定的了解。
7、熟悉nagios和cacti臨控軟件的安裝配置及原理。
存儲:
1、linux下的高級存儲管理技術(shù):Linux下磁盤陣列的實現(xiàn),實現(xiàn)了RAID的升級、遷移、擴容,并且實現(xiàn)了RAID的共享熱備、實現(xiàn)了集群邏輯卷的備份和還原;
2、Linux6下實現(xiàn)了網(wǎng)絡(luò)存儲iscsi加密配置,提高了遠程存儲的安全性;
3、利用遠程存儲iscsi實現(xiàn)了device mapper multipath多路徑,保證了遠程存儲使用的穩(wěn)定性;并且實現(xiàn)了以太網(wǎng)通道綁定bonding等技術(shù);
集群:
1、linux下的企業(yè)集群,利用紅帽集群套件實現(xiàn)了web集群的構(gòu)建,實現(xiàn)了web網(wǎng)站的高可用性,高可靠性、負載均衡、存儲共享且經(jīng)濟廉價;
數(shù)據(jù)庫:
1、實現(xiàn)了Linux6下Mysql源碼包的安裝,熟悉使用Mysql查詢語句從表中查詢獲取信息;
2、實現(xiàn)了Mysql數(shù)據(jù)庫的備份和還原,加強了Mysql的安全性;
3、成功使用第三方軟件管理Mysql,使得Mysql的管理更加方便,簡潔;
4、用mysql-proxy代理實現(xiàn)了Mysql的讀寫分離,并且實現(xiàn)了Mysql主從同步、AB復(fù)制; 語言:
1、熟悉linux下的shell的編寫比如對通過日志找出對服務(wù)器的ssh進行攻擊的IP進行統(tǒng)計并用防火墻進行隔離等。
網(wǎng)絡(luò):
1、對常見的網(wǎng)絡(luò)問題有一定的診斷與解決的能力,并可以對用戶的需求提供技術(shù)支持。
2、熟悉TCP/IP協(xié)議,熟悉常見的網(wǎng)絡(luò)協(xié)議的協(xié)商與工作原理。
3、熟悉常見的交換技術(shù),如VLAN、TRUNK、VRRP、HSRP(思科專有)、STP、RSTP、CHANNEL等。
4、熟悉常見的路由技術(shù),如靜態(tài)路由、策略路由、RIP、OSPF。
5、熟悉常見的邊界WAN技術(shù),如NAT、PPPOE、ppp等。
6、熟悉常見的VPN,如PPTP、L2TP、IPSEC。
7、熟悉cisco的常見路由與交換的配置。
了解常見防火墻的工作原理與安裝。
項目經(jīng)驗:
模擬項目一:
項目名稱:紅帽企業(yè)版虛擬化管理技術(shù)
承擔(dān)工作:負責(zé)整個項目的搭建,H端、管理端M端、共享存儲的搭建,以及對虛擬機的集中化管理。
項目簡介:紅帽企業(yè)版虛擬化管理技術(shù),RHEV由Hypervisor端和M管理端組成,不僅節(jié)省了空間和成本,利用有限的成本,使服務(wù)器優(yōu)化,特別是遠程管理的實現(xiàn),使得管理更加的便捷,并保證了服務(wù)器24小時不間斷、穩(wěn)定運行
模擬項目二:
項目名稱: 門戶級30萬并發(fā)訪問的大型開源網(wǎng)站
承擔(dān)工作:負責(zé)搭建lnmp環(huán)境和后臺Mysql數(shù)據(jù)庫的源碼包搭建,實現(xiàn)了數(shù)據(jù)庫的讀寫分離、AB復(fù)制,以及mysql-proxy代理
項目簡介:這個項目是為了搭建一個穩(wěn)定、安全、快速、經(jīng)濟的大型web網(wǎng)站,包括源碼包的編譯安裝過程,采用 MySQL的雙機熱備、AB復(fù)制,提高數(shù)據(jù)庫安全性以及網(wǎng)站吞吐效率;搭建lnmp環(huán)境下web服務(wù)器,頁面與圖片分離,采用 squid實現(xiàn)動態(tài)頁面緩存服務(wù)器集群,采用lighttpd和分布式文件系統(tǒng)結(jié)合實現(xiàn)圖片緩存服務(wù)器集群;使用常用的主流監(jiān)控軟件nagios進行大量服務(wù)器的批量監(jiān)控,編寫自定義腳本,對服務(wù)器進行更為細致的監(jiān)控備份方案,并且使用常用備份軟件對數(shù)據(jù)庫進行備份還原,以及各種災(zāi)備、容災(zāi)技術(shù)。
教育背景:
2007年7月--2010年6月 畢業(yè)院校:湖南外國語職業(yè)學(xué)院/大專專業(yè):計算機信息管理
自我評價:
1、對人真誠熱情,能很好地與人溝通,具有團隊合作精神。
2、有較強的學(xué)習(xí)能力,善于發(fā)現(xiàn)自身技術(shù)上的不足,通過自學(xué)來彌補。
3、平時喜歡鍛煉,喜歡有挑戰(zhàn)的工作,通過挑戰(zhàn)來提升自己。
第二篇:linux運維工程師簡歷
個人簡歷
個 人 簡 歷
基本信息 姓 名: 工作經(jīng)驗:
性 別: 聯(lián)系電話: 年 齡: 電子郵件:
求職意向 Linux工程師 系統(tǒng)工程師
專業(yè)技能 1.熟練搭建linux/windows系統(tǒng)各類服務(wù),如WEB、Mail、Puppet、DNS、Vsftp、svn等;
2.熟悉Linux shell環(huán)境,熟練使用shell腳本編程,并熟悉運用awk、sed等腳本輔助工具;
3.熟悉Iptables、Cacti、Nagios、Ntop、Nessus、zabbix等配臵; 4.熟悉Mysql、Ldap、Oracle RAC集群搭建配臵和基本的sql語句; 5.熟悉Oracle的冷熱備份、閃回技術(shù)及基本管理;
6.熟悉配臵常見的web集群,軟件LVS+keepalived等;
7.熟悉F5、IDP、Cisco、h3c路由器、交換機、防火墻的常用配臵;
8.熟悉虛擬化vmware搭建及管理,了解KVM,XEN虛擬技術(shù)和云計算平臺; 教育背景 2008-09至 2011-07 北京外事研修學(xué)院 2010-03 至2012-06 北大青鳥APTECH 所獲證書 OSTA高新技術(shù)認證 紅帽RHCE認證 信息系統(tǒng)專家
北京外事研修學(xué)院??飘厴I(yè)證
工作經(jīng)歷 時間/公司 2011/7 至今 北京市致遠科技有限公司 崗 位: Linux工程師 崗位職責(zé):
1.負責(zé)網(wǎng)站平臺的更新升級和對用戶使用的問題進行解決,協(xié)助分析系統(tǒng)bug跟蹤處理進度,負責(zé)服務(wù)器日常維護,負責(zé)搭建及維護監(jiān)控平臺,編寫并及時更新工作手冊;
2.登錄服務(wù)器檢查數(shù)據(jù)庫Oracle Rac、ogg運行情況;3.每日檢查oracle、RSA、ldap、F5、IDP備份及Linux系統(tǒng)資源運行狀況; 4.負責(zé)系統(tǒng)平臺上線及更新并進行系統(tǒng)新功能的測試,并編寫測試報告運維報告相關(guān)文檔;
5.編寫常用腳本提高運維的準確和效率率,如oracle rman、ldap備份腳本; 6.定期對存儲Ibm v7000健康檢查; 7.管理和維護RSA、ldap、WEB等服務(wù); 8.定期對機房主機設(shè)備進行健康檢查; 9.搭建監(jiān)控平臺nagios,并且負責(zé)后期的維護開發(fā); 10.定期統(tǒng)計相關(guān)數(shù)據(jù),比如系統(tǒng)訪問量、訪問人數(shù);
項目經(jīng)驗 項目名稱(一):金宏工程 崗 位:運維工程師 項目職責(zé):
1.負責(zé)服務(wù)器的日常運維、應(yīng)用調(diào)整和優(yōu)化, 性能優(yōu)化, 增強系統(tǒng)可用性; 2.負責(zé)部署如ftp、nomn、web、mail、apache等常用的服務(wù)器; 3.編寫常用的shell與crontab結(jié)合實現(xiàn)一些任務(wù)自動化; 4.負責(zé)維護國家外會管理局網(wǎng)絡(luò)核銷系統(tǒng)和金宏系統(tǒng); 5.負責(zé)通過電話解決客戶所遇到的系統(tǒng)故障及問題; 項目名稱
(二):構(gòu)建高可用網(wǎng)絡(luò)架構(gòu)平臺 軟件環(huán)境:red hat enterprise linux 5.4 硬件環(huán)境:10臺DELL R410 項目描述:由于公司服務(wù)器更新,所以需要重新構(gòu)建網(wǎng)絡(luò)環(huán)境。該項目的要求是:實現(xiàn)對公司網(wǎng)絡(luò)服務(wù)的監(jiān)控及管理,實現(xiàn)HA和LVS的高可用性負載均衡群集,mysql群集,SAN網(wǎng)絡(luò)區(qū)域存儲,使服務(wù)更安全高效。責(zé)任描述: 1.負責(zé)為服務(wù)器批量安裝linux系統(tǒng)。
2.負責(zé)構(gòu)建HA和LVS負載均衡和高可用性群集。3.負責(zé)搭建LNMP網(wǎng)站平臺和mysql群集。4.負責(zé)iptables防火墻腳本編寫及測試。5.對整個項目中遇到的問題進行分析和測試。
自我評價 興趣愛好:象棋〃足球〃看書 自我評價:
適應(yīng)能力強、認真刻苦,不怕挫折,為人樂觀積極向上,有責(zé)任感。沉穩(wěn)理性,遇事鎮(zhèn)定,積極尋求解決辦法,專注工作,服從管理,注重效率,對于新事物具有很好的學(xué)習(xí)能力。
第三篇:運維簡歷
個人簡歷
個人資料
姓
名: 聯(lián)系方式:
畢業(yè)院校:
學(xué)
歷: 本科
求職意向
運維工程師、網(wǎng)絡(luò)管理員
實踐項目
項目1: LAMP論壇搭建
性
別:
年
齡:
專
業(yè): 計算機科學(xué)與技術(shù) 郵
箱:
軟件環(huán)境:redhat Enterprise linux 5.8、httpd-2.2.11、mysq、php-5.2.9 實踐目的: 編譯安裝Apache、Mysql、php,搭建LAMP環(huán)境下的PHP論壇 參與過程:獨立完成
項目2:NFS方式無人值守安裝 軟件環(huán)境:redhat Enterprise linux6.4 實踐目的: 在一臺服務(wù)器上安裝rhel 6,并在其上配置DHCP,TELNET,TFTP等服務(wù)提供安裝源,實現(xiàn)NFS方式的無人值守安裝
參與過程:獨立完成 項目3:nginx服務(wù)器配置
軟件環(huán)境:redhat Enterprise linux 6.4
nginx-0.8.55.tar.gz 項目描述:
web服務(wù)器下nginx的平滑升級 參與過程:獨立完成
項目4:Mysql 主從復(fù)制與讀寫分離
軟件環(huán)境:redhat Enterprise linux 6.4 下,mysql相關(guān)軟件包
項目描述:兩個獨立的數(shù)據(jù)庫,可以讀寫分離,讀寫入一個數(shù)據(jù)庫,從另一個數(shù)據(jù)庫讀出來 參與過程:獨立完成 實習(xí)經(jīng)歷
2013.07-2013.12 職業(yè)技能
1、linux方面:
熟練linux下各種管理,精通基本操作,熟練搭配各種服務(wù)器如DNS、apache、nfs、ftp nginx、tomcat等服務(wù)器并簡單維護
有一定的Shell編程能力,熟練使用awk、sed等系統(tǒng)工具完成文件操作
2、軟件開發(fā)編程:
精通C語言編程,熟悉C++,java, J2EE ,VB,.NET等語言編程
3、數(shù)據(jù)庫:
熟練mysql下數(shù)據(jù)庫的各種基本操作,實現(xiàn)mysql主從復(fù)制,讀寫分離,集群等配置
其他技能
1、語言能力:能熟練大量閱讀文學(xué)方面文檔
2、學(xué)習(xí)能力:有較強的好奇心并快速接受新事物并熟悉它
自我評價
具有較強的責(zé)任心,做事踏實認真;為人坦誠,善于與人交流溝通,可以很好的融入集體;專業(yè)知識扎實,具有較好的獨自分析問題解決問題的能力。
第四篇:系統(tǒng)運維工程師
系統(tǒng)運維工程師
系統(tǒng)運維工程師年終個人工作總結(jié)及下年工作計劃
時間一晃而過,彈指之間,2010年悄然而至,自從2010年3月份剛進入公司,我是第一次接觸公司、接觸通信行業(yè)、接觸公司網(wǎng)絡(luò)管理及維護。雖然跟我的專業(yè)和技能都一致,但所有的實際經(jīng)驗都是第一次,讓我沒有任何準備,同樣也打消了任何顧慮,人生就是這樣,所有的一切都是要從第一次開始,沒有接觸過、干過并不可怕,領(lǐng)導(dǎo)給了我機會,讓我有了一次嘗試、一次展現(xiàn)自己的平臺,那么我一定會更加倍的努力做好工作才是最大的回報。并且也是對自己的一次肯定。經(jīng)過一段時間的工作及陌生環(huán)境的磨合,專心鉆研業(yè)務(wù)知識,努力提高理論知識和業(yè)務(wù)工作水平。遵紀守法,踏實工作認真完成領(lǐng)導(dǎo)交辦的各項工作任務(wù),使自己漸漸的融入和適應(yīng)到新的工作環(huán)境中。過去的大半年里在領(lǐng)導(dǎo)和同事們的悉心關(guān)懷和支持幫助下,通過自身的不懈努力,在思想、學(xué)習(xí)和工作等方面取得了新的進步?,F(xiàn)總結(jié)如下:
一、公司電腦日常維護工作
剛一開始接手工作的時候,發(fā)現(xiàn)公司大部分工作電腦都沒有安裝安全防護軟件和升級系統(tǒng)補?。粏T工隨意安裝系統(tǒng)及應(yīng)用軟件,致使公司局域網(wǎng)內(nèi)病毒隱患嚴重、工作不穩(wěn)定和系統(tǒng)崩潰,工作秩序被打亂,員工不嚴格要求自己,上班時間聊QQ、玩農(nóng)場、看娛樂網(wǎng)站等;為此公司和個人工作經(jīng)常受到影響,工作效率降低。針對這種情況,我采取了以下措施:
1、先對公司員工進行一次基本知識培訓(xùn),讓員工了解到計算機的正確使用方法,病毒防范,重要文件的備份等。從而大大提高了員工對電腦使用的熟練程度。
2、先恢復(fù)良好的秩序。電腦使用時如發(fā)現(xiàn)故障和需更改設(shè)置,必須先報告公司運維人員,由專門人員來進行專業(yè)及針對化的操作,個人不能私自進行改動,進行這樣做的目的避免由于人為的盲目操作使某一臺電腦的故障影響整個局域網(wǎng)內(nèi)的其它工作,使故障擴大化,并延長了解決問題的周期。
3、使員工使用統(tǒng)一的、經(jīng)過安全測試的系統(tǒng)及應(yīng)用軟件,安裝、設(shè)置統(tǒng)一的殺毒軟件、防火墻等安全防護軟件,且經(jīng)過努力實踐,并在每臺機器上設(shè)定了自動系統(tǒng)補丁升級及定期查殺規(guī)則。
4、對于個人的關(guān)鍵性數(shù)據(jù)資料、郵件進行路徑轉(zhuǎn)移備份,使這些數(shù)據(jù)遠離危險故障點,避免意外丟失所帶來的嚴重后果。操作系統(tǒng)進行常規(guī)定期備份,便于事后的還
原。
5、對于網(wǎng)絡(luò)管理進行了監(jiān)管工作,公司所有電腦安裝了行為管理軟件后,員工工作效率逐步提高,自覺性得到明顯改進,從而凈化了公司網(wǎng)絡(luò)辦公環(huán)境。
經(jīng)過一段時間的貫徹和工作,先前的混亂現(xiàn)象得到有效控制,現(xiàn)公司的十余臺電腦,工作狀態(tài)穩(wěn)定,沒有出現(xiàn)大面積的系統(tǒng)崩潰和故障。
二、網(wǎng)絡(luò)的日常維護
路由器及交換機的維護管理,確保公司網(wǎng)絡(luò)運行正常,員工正常利用網(wǎng)絡(luò)資源。加強路由器的規(guī)則設(shè)置,優(yōu)化外網(wǎng)接口,內(nèi)部員工合理地分配帶寬流量,使公司的網(wǎng)絡(luò)能穩(wěn)定有效地工作。
三、公司網(wǎng)絡(luò)制度管理和完善
公司經(jīng)過一段時間的運轉(zhuǎn),各個部門的規(guī)章制度通過大家一起研究、探討、立會并完善制定了各項規(guī)章制度,計算機管理也形成了制度,大家按章辦事,使之成為一種工作習(xí)慣。同時公司的資產(chǎn)管理及日常的文書表格非常混亂和環(huán)節(jié)上的缺失。為此特地制作了一批表格、登記申請單及統(tǒng)計表。使得公司資產(chǎn)和資源得到有效的管理和控制,杜絕管理上的失控和資產(chǎn)流失。
四、公司服務(wù)器平臺管理與維護工作
公司發(fā)展逐步擴大,對于公司所有的業(yè)務(wù)支撐平臺-服務(wù)器,為重中之重;本我司服務(wù)器相應(yīng)出現(xiàn)幾次重大故障,分別如下:
1、網(wǎng)絡(luò)故障七次,重大一次,因服務(wù)器遭DDOS攻擊,導(dǎo)致我司服務(wù)器無法正常工作。事后通過緊急處理后得以恢復(fù)正常。其它幾次分別為機房斷電、網(wǎng)絡(luò)升級、電信與聯(lián)通DNS解析故障影響到我司服務(wù)器平臺網(wǎng)絡(luò)連接不正常。
2、系統(tǒng)故障三次,其中一次為短信平臺服務(wù)器系統(tǒng)文件損壞,導(dǎo)致系統(tǒng)崩潰。經(jīng)過技術(shù)部采用緊急預(yù)案措施在兩小時內(nèi)得以恢復(fù)系統(tǒng)。
3、其它故障共計5次,因聯(lián)通網(wǎng)關(guān)溢出,無法與我司IVR服務(wù)器數(shù)據(jù)庫網(wǎng)關(guān)同步,導(dǎo)致用戶無法正常訂購與使用我司親情相伴業(yè)務(wù)。
經(jīng)過出現(xiàn)幾次重大故障后,技術(shù)部多次研究與討論,制定出一套完善的應(yīng)急措施與日常維護計劃。盡量歸避風(fēng)險及減少事故發(fā)生,同時確保做到問題提前預(yù)防、及時發(fā)現(xiàn)、迅速解決并恢復(fù)正常運營。
4、針對服務(wù)器出現(xiàn)在問題所在,在技術(shù)部其它同事的配合下完成服務(wù)器的重新部署,訪問權(quán)限及安全性的提高,數(shù)據(jù)庫優(yōu)化等相關(guān)措失后,目前服務(wù)器已運行正常。
5、公司針對員工的工作崗位與職位重新部署了FTP服務(wù)器的訪問權(quán)限與互聯(lián)網(wǎng)訪問,使每個員工都能把重要的文件放到服務(wù)器上相關(guān)部門的文件夾里作備份,且通過內(nèi)外網(wǎng)均可實現(xiàn)訪問FTP服務(wù)器,大大方便了員工在外出差或在家里隨時提取相關(guān)資料,且員工的訪問權(quán)限不一樣,故某些與自己無關(guān)或公司重要資料進行了保密設(shè)置,從而大大提高了公司重要資料的完整性與保密性。總結(jié)本的工作,盡管有了一點點的進步和成績,但在一些方面還存在著很多的不足。比如:工作經(jīng)驗不足,對公司的網(wǎng)絡(luò)與辦公環(huán)境未得到很大的改善;遇到困難的時候與領(lǐng)導(dǎo)溝通不夠等等,這都有待于在今后的工作中加以改進。
在新的一年里,將百尺竿頭,更進一步,2011年的大致工作計劃為:
1、在公司內(nèi)部使用一種簡便、有效的軟件工作平臺,使之便于公司所有員工的工作、交流、探討,發(fā)布公共信息等(如OA軟件)。
2、利用投影儀設(shè)備資源制作會議幻燈片為員工培訓(xùn)計算機操作及工作常用軟件知識的小竅門,爭取進一步提高全公司工作人員的專業(yè)化及工作效率。
3、解決企業(yè)網(wǎng)站制作等專業(yè)性知識問題,業(yè)余時間強化學(xué)習(xí)并能勝任網(wǎng)站管理工作。
4、進一步增強IT系統(tǒng)和網(wǎng)絡(luò)系統(tǒng)的穩(wěn)定性和管理,使用更為高效的域控制系統(tǒng)來代替目前的工作組局域網(wǎng),使內(nèi)、外網(wǎng)連接任意,在任何地方工作都能連接本公司服務(wù)器資源。
5、重新改建機房機柜網(wǎng)絡(luò)布線,使機柜走線更加美觀,同時方便以后維護時線路排除更加明了,直觀。
6、在資金允許的情況下對公司辦公電腦、網(wǎng)絡(luò)、會議系統(tǒng)布署方案升級優(yōu)化,進一步提高員工工作效率,為公司節(jié)約成本開支。
7、學(xué)習(xí)更多的網(wǎng)絡(luò)知識,充分的將一些新的技術(shù)應(yīng)用到公司當(dāng)中來。為公司提供更優(yōu)質(zhì)、更便捷、更效率、更節(jié)能的辦公方式。
2011年,是全新的一年,也是自我挑戰(zhàn)的一年,我將努力改正過去一年工作中的不足,強化理論和業(yè)務(wù)學(xué)習(xí),不斷提高自身綜合素質(zhì),把新一年的工作做好,為公司更好的發(fā)展盡一份力!
擴展閱讀:如何 成為系統(tǒng)運維工程師 要成為系統(tǒng)運維工程師,需要學(xué)習(xí)那些課程?Windows、Linux、網(wǎng)絡(luò)和Oracle哪些知識點需要學(xué)習(xí),武漢怎么參加培訓(xùn)?
[標(biāo)簽:工程師,linux,oracle] 聽前輩說軟件開發(fā)工程師,以及系統(tǒng)運維工程師,在考慮選擇。大家?guī)兔φf一下我該選什么?學(xué)習(xí)哪些內(nèi)容?才畢業(yè)沒什么工作經(jīng)驗,該如何準備?
系統(tǒng)運維要求什么都懂一點,主要是基于Linux、UNIX有前途,shell網(wǎng)絡(luò)數(shù)據(jù)庫都需要懂一些。越老越吃香知識不需要太多創(chuàng)造性的東西了解基本規(guī)律然后去部署排錯以后轉(zhuǎn)管理。
我們來看看系統(tǒng)運維都有一些什么要求深入了解Linux/Unix操作系統(tǒng) 深入了解分布式系統(tǒng)、計算機網(wǎng)絡(luò)、硬件體系結(jié)構(gòu)
精通Linux/Unix環(huán)境下腳本語言(Shell、Perl、PHP、JSP、Python)的編程熟練使用grep、awk、sed、vi等系統(tǒng)工具
可以學(xué)RHCE+CCNP+OCP RHCE是紅帽Linux認證目前最普及的企業(yè)版LINUX發(fā)行版的認證學(xué)了通吃LINUX再學(xué)一下AIX就UNIX搞定;可以朝RHCA發(fā)展
CCNP基本是思科網(wǎng)絡(luò)工程師比較成熟基礎(chǔ)的技能培訓(xùn)認證,將來有錢了可以朝CCIE發(fā)展
OCPOracle數(shù)據(jù)庫DBA認證專家也是成熟的基礎(chǔ)認證,可以發(fā)展為OCM 這個課程可塑性很強延展性出去能滿足絕大多數(shù)的工作需求至于日常的局域網(wǎng)維護硬件什么的就不說了
你是武漢的話你可以找授權(quán)培訓(xùn)官網(wǎng)都可以查 武漢譽天RHCE+CCNP+OCP 系統(tǒng)運維做的很多啊網(wǎng)絡(luò)操作系統(tǒng)數(shù)據(jù)庫網(wǎng)站運維《互聯(lián)網(wǎng)運營智慧--高可用可擴展網(wǎng)站技術(shù)實戰(zhàn)》本書深入淺出地介紹運維架構(gòu)中的各個節(jié)點,從網(wǎng)絡(luò)規(guī)劃到服務(wù)器安裝到負載均衡、分布式文件系統(tǒng)等架構(gòu)規(guī)劃,無一不囊括,包括:從簡要說明選擇開源技術(shù)作為運營環(huán)境開篇,到選定平臺及工具的部署實施,以實例展示如何使用開源工具,來實現(xiàn)用戶訪問量在1000萬這樣的一個級別的站點功能。
運維工程師熟悉tcpip系列協(xié)議,熟練配置思科和華為網(wǎng)絡(luò)能參考手冊配置其他廠商設(shè)備包括安全設(shè)備
熟悉服務(wù)器硬件系統(tǒng)配置操作系統(tǒng)unixlinuxwindows等安裝配置檢測其運行等 熟悉常見的應(yīng)用如webftp郵件等服務(wù)搭建及排查熟悉常見的系統(tǒng)安全設(shè)置,以及整個安全體系架構(gòu)
會安裝及配置維護常見數(shù)據(jù)庫oraclemysqlsql-server等有一定的存儲方面的知識。。。。
要熟悉你服務(wù)器的環(huán)境相關(guān)的東西特別是網(wǎng)絡(luò)相關(guān)
熟悉服務(wù)器的硬件配置熟悉服務(wù)器上的操作系統(tǒng)及各種常見的應(yīng)用系統(tǒng)熟悉發(fā)生故障的時候處理流程等
不強求你精通內(nèi)核調(diào)優(yōu)等但是你知識要全面而且有一兩手是拿手的 主要想當(dāng)linux運維,服務(wù)器管理方面 最佳答案
操作:下個虛擬機,裝CentOS。
教材:《鳥哥的Linux私房菜基礎(chǔ)學(xué)習(xí)篇》、《鳥哥的Linux私房菜服務(wù)器架設(shè)篇》第三版。這兩本書深入淺出,原理講得很透徹而易懂,不像很多書只講皮毛或很枯燥。第三版是以CentOS為例的。
RedHat官方也有教材,但是一來你沒有配套的系統(tǒng)練,二來它的原理方面不如上書講得深。
CentOS和RedHatEnterprise的源代碼是一樣的,很多都兼容。學(xué)好CentOS再遷移到RHEL很容易。如果是小型企業(yè),用CentOS就可以了。大型企業(yè)才有必要購買RHEL。
軟硬并施!軟件:主要是服務(wù)器操作系統(tǒng)和數(shù)據(jù)庫系統(tǒng)
硬件:服務(wù)器硬件,數(shù)據(jù)存儲硬件(如EMC、IBMSAS磁盤陣列,存儲服務(wù)器)網(wǎng)絡(luò):Cisco網(wǎng)絡(luò)設(shè)備,局域網(wǎng),接入網(wǎng),光纖通道存儲網(wǎng)國家電網(wǎng)的工程師,責(zé)任重于泰山!
linux運維工程師主要干些什么?有什么要求?我們知道多少?對于linux你了解多少呢?linux運維工程師職責(zé)linux運維工程師招聘linux服務(wù)器
工作職責(zé):
1、負責(zé)Linux操作系統(tǒng)的安裝、配置,系統(tǒng)監(jiān)控和維護,問題處理,軟件升級。
2、負責(zé)Linux系統(tǒng)下的常用軟件(如FTPServer、Apache、NginX、MySQL、ORACLE等)安裝及日常維護。
3、負責(zé)Linux的系統(tǒng)維護、優(yōu)化。
4、負責(zé)Linux系統(tǒng)的網(wǎng)絡(luò)安全及數(shù)據(jù)日常備份。
5、會編寫常用的SHELL腳本。
6、能獨立完成新軟件的安裝和配置及工作文檔
7、了解Web技術(shù)/Java語言開發(fā),支持其他部門工作。
8、了解TCP/IP/UDP/DDNS協(xié)議,能在Linux配置包括網(wǎng)站服務(wù)器,以及DNS/DDNS,和DHCP服務(wù)器等。
職位要求:
1、具有2年以上Linux系統(tǒng)維護的經(jīng)驗,熟悉Linux/Unix常用服務(wù)的安裝配置與使用
2、精通Linux系統(tǒng)原理,熟悉內(nèi)核參數(shù)調(diào)諧,精通基于linux的常用服務(wù)配置,如mail/nginx/dns等,并能夠快速部署;深入掌握apache、tomcat及weblogic配置及調(diào)優(yōu)
3、熟悉Linux系統(tǒng)架構(gòu),管理以及優(yōu)化。
4、熟練掌握LINUX網(wǎng)絡(luò)安裝、配置、日常管理、安全、備份、恢復(fù)、故障處理、日志分析等技能。
5、熟悉虛擬機技術(shù),熟悉虛擬化架構(gòu)下的系統(tǒng)維護、分布式管理、容錯、備份等技術(shù)。
6、熟練掌握交換機,防火墻等常用網(wǎng)絡(luò)設(shè)備的配置,熟悉TCP/IP協(xié)議
7、熟練相關(guān)應(yīng)用服務(wù)器如web、email、ftp、http等
linux運維工程師主要干些什么?有什么要求?我們知道多少?對于linux你了解多少呢?linux運維工程師職責(zé)linux運維工程師招聘linux服務(wù)器
工作職責(zé):
1、負責(zé)Linux操作系統(tǒng)的安裝、配置,系統(tǒng)監(jiān)控和維護,問題處理,軟件升級。
2、負責(zé)Linux系統(tǒng)下的常用軟件(如FTPServer、Apache、NginX、MySQL、ORACLE等)安裝及日常維護。
3、負責(zé)Linux的系統(tǒng)維護、優(yōu)化。
4、負責(zé)Linux系統(tǒng)的網(wǎng)絡(luò)安全及數(shù)據(jù)日常備份。
5、會編寫常用的SHELL腳本。
6、能獨立完成新軟件的安裝和配置及工作文檔
7、了解Web技術(shù)/Java語言開發(fā),支持其他部門工作。
8、了解TCP/IP/UDP/DDNS協(xié)議,能在Linux配置包括網(wǎng)站服務(wù)器,以及DNS/DDNS,和DHCP服務(wù)器等。職位要求:
1、具有2年以上Linux系統(tǒng)維護的經(jīng)驗,熟悉Linux/Unix常用服務(wù)的安裝配置與使用
2、精通Linux系統(tǒng)原理,熟悉內(nèi)核參數(shù)調(diào)諧,精通基于linux的常用服務(wù)配置,如mail/nginx/dns等,并能夠快速部署;深入掌握apache、tomcat及weblogic配置及調(diào)優(yōu)
3、熟悉Linux系統(tǒng)架構(gòu),管理以及優(yōu)化。
4、熟練掌握LINUX網(wǎng)絡(luò)安裝、配置、日常管理、安全、備份、恢復(fù)、故障處理、日志分析等技能。
5、熟悉虛擬機技術(shù),熟悉虛擬化架構(gòu)下的系統(tǒng)維護、分布式管理、容錯、備份等技術(shù)。
6、熟練掌握交換機,防火墻等常用網(wǎng)絡(luò)設(shè)備的配置,熟悉TCP/IP協(xié)議
7、熟練相關(guān)應(yīng)用服務(wù)器如web、email、ftp、http等
第五篇:漫談運維—運維工程師
《談網(wǎng)站或其他服務(wù)器運維》,這里只談運維工程師所要做的細節(jié)工作,讓人們知道運維工程師到底都在做些什么,至于上級所要做的,只是提一下,不做參考。
以下是個人觀點,我說的只是我自己的想法,也是我發(fā)展的目標(biāo)。你可以有異議,我們是來交流的。你對的我肯定會向你學(xué)習(xí)。因為我也在摸索。運維工程師至少要能做以下的工作:
1,網(wǎng)絡(luò)工程師的工作
你至少要能配置CISCO 6509以下的設(shè)備,熟悉各種網(wǎng)絡(luò)協(xié)議,否則網(wǎng)絡(luò)出問題的時候你會傻掉。
2,系統(tǒng)工程師的工作
你至少要理解各種系統(tǒng)服務(wù),在出問題的情況下要迅速解決問題,而不是等系統(tǒng)工程師來解決。
3,安全工程師的工作
我不要求你一定要會各種網(wǎng)絡(luò)編程,但是在服務(wù)器收攻擊的情況下,沒有防火墻的情況下,做一些簡單的處理工作。
4,存儲工程師的工作
至少要熟悉各個廠商的設(shè)備,各種備份和還原的辦法
5,測試工程師的工作
在新版本上線之前,你至少要協(xié)同測試工程師做測試工作,因為你是運維人員,不了解程序架構(gòu)導(dǎo)致無法解決故障,你也有一份責(zé)任。
6,研發(fā)人員的工作
運維工具都需要自已開發(fā),熟悉開發(fā)語言,需要有過實際開發(fā)經(jīng)驗,否則工作會非常痛苦,我深有體會。
7,英語
不想說了,我的最大痛苦就在這里
8,好的溝通者 不出問題時候你可以打游戲睡覺,出問題的時候要能和項目人員溝通,快速解決問題,而不是推;我知道有很多人能推責(zé)任,你可以做替死鬼,但是離開這個工作你還能找到更好的;把責(zé)任推到別人身上的人,下次出問題的時候,絕對沒人幫你。你要能和各個兄弟部門關(guān)系非常的密切,出了問題有兄弟幫你擔(dān)責(zé)任;也要能非常扯皮,沒事在會議上把別人都搞定。
9,庫房管理員
數(shù)萬臺服務(wù)器讓你來管理,任何丟失或者損壞都是不負責(zé)任和失職的表現(xiàn)。
10,運動員
不要回家就睡覺,有空還是運動下吧;在服務(wù)器down機的時候,機房恰巧就你一個人,機柜沒有空間,你需要更換一臺HP 585 4U的服務(wù)器,滿配約80公斤的服務(wù)器,你怎么做?
11,責(zé)任心
這個我不想說什么,這是你的職業(yè)精神。
12,組織者
給你2個啥都不會的民工,再給你2000臺服務(wù)器,要求你2天把服務(wù)器裝完,你咋辦?
13,1-7條中,你必須有一條非常精通,是這個行業(yè)的專家。否則過了32歲,沒有公司要你。
大家看了肯定覺得這個人是神仙,但是這必須是你慢慢能做到的,至少是我6年來運維經(jīng)驗的一點總結(jié)。
因為現(xiàn)在的公司都在用招聘民工的錢招聘神仙,其次我也是想讓各位看看,運維工程師要擔(dān)負多少責(zé)任。
我去面試過的一些公司都說,你什么都會,什么都不精。我說對,正是需要我們這些什么都會的人領(lǐng)導(dǎo)什么都精的人。
我這句話沒有貶低大牛的任何意思,只是當(dāng)時一個臨場的發(fā)揮。雖然說完就知道這個面試白來了,但是我還是想為廣大的運維工程師出口氣。
不怕千招會,就怕一招精。這仍舊是我給大家的建議。
最后給大家最后最大最重要的建議,做什么工作都可以,千萬別做SA。我把SA的定義成:speediness answer而不是system admin。為什么?你可以想象一下哪些工作需要快速響應(yīng)。網(wǎng)絡(luò)工程師需要,機房網(wǎng)絡(luò)骨干交換機故障,整個機房所有服務(wù)器無法連接,需要快速響應(yīng)不?系統(tǒng)工程師需要,系統(tǒng)出問題了,要快速響應(yīng)不?安全工程師需要,服務(wù)器被攻擊了,要快速響應(yīng)不?存儲工程師需要,公司核心存儲有問題了,要快速響應(yīng)不?
你可以做研發(fā),出了問題可以測試,可以想辦法慢慢解決;你可以做DBA,出了問題可以推到網(wǎng)絡(luò)工程師或者系統(tǒng)工程師身上,說不是DB連接問題;你可以做測試工程師,你說有問題這個東西就可以不上線??在出問題的時候,倒霉的就是SA,所以不要再爭論SA包含哪些工作,SA就是一個倒霉的快速響應(yīng)者,你想,哪個SA 24小時不開手機?哪個SA 晚上可以舒服的睡覺或者安心的出去度假?走在路上一聽到和自己手機短信鈴聲一樣的,利馬下意識的抓出自己的手機看看是不是服務(wù)器報警;晚上和老婆 XXOO00,一個電話過來,立馬停下,抓出手機看流量圖;包里放著筆記本,但是因為還要開機,太慢,拿著手機上putty ping或者telnet機器??
這就是大家羨慕的SA,你也不要抱怨自己做了SA,生活就是這樣。所以不要再爭論哪些xxx員應(yīng)該歸屬于SA,系統(tǒng)管理員或是運維工程師,如果想做這行,就安生的當(dāng)一個“快速響應(yīng)者”,這是你的職業(yè),也是你需要做到的。作為一個SA,你肯定經(jīng)歷過通宵好幾天加班做事,你肯定經(jīng)歷過飯買來已經(jīng)忘記了吃,你肯定經(jīng)歷過幾天加班沒睡覺,著個沙發(fā)坐下就失去知覺睡倒??沒有經(jīng)歷過不能說你不好,只能說你管理的機器太少。
我公司是每月發(fā)21天工資,某兩月我一月發(fā)了44天工資一月發(fā)了47天工資,創(chuàng)全公司建司7年來加班記錄??項目做完自然也就落了個部門通告表揚,然后的結(jié)果就是健康情況急劇下滑,然后就是某天晚上在機房內(nèi)加班一通宵,穿著短褲進機房,然后一個通宵被機柜下面的冷風(fēng)吹了個關(guān)節(jié)炎??這就是做SA的代價。
以下是一些實際經(jīng)驗,發(fā)給大家做參考,有任何問題可以mail我,answer3ai@gmail.com
有的東西是企業(yè)機密,我不能透露也不能給你相關(guān)文檔。
一,架構(gòu)設(shè)計
現(xiàn)在你要做的,就是設(shè)計你的服務(wù)器架構(gòu)和網(wǎng)絡(luò)架構(gòu)。這要先看你的網(wǎng)站是做什么的,每日有多少的人數(shù)訪問,例如,我打算站點初期每日有20000左右的訪問量,和1000人左右的并發(fā)量。我可以用我的人數(shù)并發(fā)量1000×站點中每個頁面的平均大小200k×每個訪問用戶可能要打開4個網(wǎng)頁=800 000k=800M的網(wǎng)絡(luò)流量(當(dāng)然這個數(shù)字肯定是非常的過分,至于為啥,自己可以想下)
然后可以用測試環(huán)境用軟件檢測在你的真實環(huán)境下的服務(wù)器壓力,比如在2000人在線的情況下,服務(wù)器的cpu占用多少,內(nèi)存占用多少。
那么你可以得到你大致配置,其實市面上的標(biāo)準服務(wù)器配置都足夠你用了,比如現(xiàn)在的DELL 1950,HP DL360G5,IBM X???(忘記了)
等服務(wù)器,足夠我跑一個這樣簡單的網(wǎng)站。其實說白了,雙奔3都夠,真的。當(dāng)然你網(wǎng)站的流量比我要大的多,那你可以買的更好一點的服務(wù)器?;蛘哓撦d均衡器。
網(wǎng)絡(luò)架構(gòu)
站點現(xiàn)在是一臺獨立服務(wù)器,未來采用的是分布式架構(gòu),比如bbs.hilinux.com是一臺服務(wù)器,man.hilinux.com是一臺服務(wù)器??
mysql是一臺服務(wù)器。這樣你要算服務(wù)器要多少臺,交換機要多少口,防火墻要買什么級別的。
哪些服務(wù)器可以放在一個防火墻下,哪些服務(wù)器不用防火墻保護,哪些服務(wù)器是內(nèi)網(wǎng)服務(wù)器,需要什么樣的網(wǎng)絡(luò)連接,最好是畫出大致拓撲,方便你預(yù)算設(shè)備花費。
服務(wù)器交換機等設(shè)備選型和購買
說的簡單點就是買什么機器,你可以和google一樣開始,買幾臺pc作為你的網(wǎng)站服務(wù)器,也可以自己組裝一臺服務(wù)器
或者也可以和我一樣,去挑選品牌服務(wù)器當(dāng)然,現(xiàn)在你要看你服務(wù)器做什么的,你可以親自去電腦城看組裝服務(wù)器,也可以打電話到IBM,HP,DELL的各地銷售商讓他們送服務(wù)器來測試,當(dāng)然你不要告訴他們你只買一臺,那你就別指望測試了。我告訴供貨商hilinux.com需要200臺服務(wù)器,一個F5,10臺CISCO 2960交換機,3個NETSREEN206防火墻,一個EMC CX500+滿硬盤 那么不到3天,hilinux.com所需要的4臺測試服務(wù)器,就送來了??當(dāng)然,不要牛了這么多最后只買1臺,那么你晚上走夜路會被人打的。
最后就是價錢問題了,這個你自己看著辦吧。讓你公司的財務(wù)或者采購出馬砍價付錢就是了。當(dāng)然,除了服務(wù)器的服務(wù),你最好還是想想有利于自己的服務(wù),比如人家公司可以幫你拆箱子了什么的。我做的最弱智的一件事情就是,來了400臺服務(wù)器,50個交換機,8臺EMC,我一個人花了一星期把箱子才全部拆完??
機器選型的時候你也要為自己考慮,比如HP的ILO功能,可以讓你遠程BIOS級操作服務(wù)器,比如浪潮的自動資產(chǎn)管理等等,為自己管理服務(wù)器提供便利,否則機器10來臺還好,100臺還一般,我這里3萬來臺,我不死幾百遍了。丟失一臺服務(wù)器,幾個月工錢就沒了??
二,IDC選擇
首先要看你服務(wù)的地區(qū)是哪里,然后再去找當(dāng)?shù)氐碾娦艡C房。畢竟,雖說全國已經(jīng)互聯(lián)了,但是各地的網(wǎng)速還是有差異的。
或者說有的IDC機房利用率高,雖然出口帶寬大,但是利用率高的結(jié)果是導(dǎo)致你網(wǎng)速慢的原因之一。
我的做法是在全國各個機房的服務(wù)器用pingplus這個軟件進行一周的的流量測試。可以看到平均丟包,最大延時等等。
當(dāng)然,你也可以到你目標(biāo)服務(wù)的地方,找個可以上網(wǎng)的地方進行網(wǎng)絡(luò)測試,比如說網(wǎng)吧包個機器??
好了,網(wǎng)絡(luò)測試完了。那么你已經(jīng)決定去哪個IDC了吧。
然后你就可以電話或者自己提著禮品登門拜訪一下IDC服務(wù)商的老大了
當(dāng)然,你也可以找代理服務(wù)商,因為他們拿到的價錢有時候比電信或者網(wǎng)通給你的價錢低,但是,關(guān)鍵還是一個服務(wù),因為你畢竟服務(wù)器放在那,晚上關(guān)鍵著急沒人給你重啟,機器出了問題其實按個F1就可以解決的問題,服務(wù)商的值班人員不懂。你就只能打晚上的打飛機去機房維護吧。
提著東西拜訪一下服務(wù)商老大是禮節(jié)性的東西,東西不在多而在精,這樣你未來談事情人家也給你綠色通道,做事情要好做很多。當(dāng)然,我也不反對你空手去,你一次租個100個機柜+10G帶寬,人家還是很優(yōu)惠的。哈哈。大家都是混口飯吃,也不至于難為你什么。
最后你要知道現(xiàn)在的中國還是賣方市場,你給人家牛,那你買的產(chǎn)品只能是??蒙牛 然后是開始去參觀機房
細心的檢查一下空調(diào)數(shù)量,空調(diào)出廠和最后維護日期,網(wǎng)絡(luò)布線類型和架構(gòu),是否可擴展,主備從電力等。
基本都是非常關(guān)鍵的東西,出問題了,人家可以給你更換一個新的,服務(wù)很好,但是你服務(wù)器掛一天的損失是多少,你可以自己掂量。
還有機柜電力,現(xiàn)在的機柜放置16臺1U的服務(wù)器是正好,多了過于熱,少了資源浪費;但是你發(fā)現(xiàn)人家只讓你用10安培電力,過了要交錢買電;
或者不限制你用電,但是插線板只有10個,你還真買個托線板去轉(zhuǎn)接?你要想想你一個托線板掛了,你服務(wù)器要掛幾個?
最后,我的一個機房包間里140個機柜,2個空調(diào),結(jié)果某天掛了一個空調(diào),雖然6小時人家IDC商就給更換了一個空調(diào)機(這速度已經(jīng)非常快了),結(jié)果我機器至少被熱死了100臺以上,機器是HP的,機器過熱,HP會自動關(guān)機,而且會不讓你啟動。你崩潰不?注:不是給hp做廣告哈。
三,服務(wù)器上架
好了,要是你買的服務(wù)器到了,你會發(fā)現(xiàn)你接到電話后,樓下一個N大的“擎天柱”集裝箱車給你送服務(wù)器來??(某次我收2000臺服務(wù)器就是這樣的陣勢);在這里有個重大的提示,你們財務(wù)給廠商下單的時候,收貨地址一定要寫對。比如 XX路XX號XX大廈XX樓XX室,你寫到xx號,送快遞的會給你堆到院子里,你寫到xx樓,送快遞的會給你送到電梯口,你寫到xx室,他們才會給你搬到室內(nèi)。因為送貨的都是服務(wù)器廠商找的,你因為這個事情去聯(lián)系廠商修改送貨地址,至少要多等N小時。而且他們視你的單子的數(shù)量和樓層,判斷來多少搬運人員。而且,一定要把服務(wù)器搬到你指定的地方再簽字收貨,否則??嘿嘿??
我最霉氣的是:來了20臺機器(還好不多),下著大雨人家給我往院子里一丟,讓我自己搬上19樓,我沒推車沒啥的??
你可以說,找電信的幫忙撒,廢話,這個我還不知道。那我告訴你,我在某電信大樓工作時,從CCIE到機房主管到機房工作人員,全部是美女??
雖然我在這個地方只干了5天活,我的同事們口水都有3尺長??你還叫人家給你搬機器不? 你可以說,雇民工撒,我又不是沒雇過,錢得你自己支付,公司不給你報銷的話,爽不?
下面是拆箱子,面對著堆積如山的2000臺服務(wù)器,我是連抬手的力氣都拿不出來??當(dāng)時機房只有我們公司3個人+電信值班2個人??
這時候,我的辦法是??我打電話找來了2隊收廢品的:
這么多箱子,除了機器和電源線留下,里頭的導(dǎo)軌光盤等等你全部拿走,誰拆的多誰拿的多??
最后按照我的要求幫忙搬到機柜上??于是我們5個人是監(jiān)工??看人家拆箱子搬機器。
于是人家2隊人找來了30多號人,一早上把2000臺機器全部拆箱子完畢放到機柜上。
要是我們幾個人拆,估計????
最后再說個行價,服務(wù)器箱子一個價值5塊錢甚至更多。你服務(wù)器到了,賣賣箱子請大家吃飯吧。別讓掃地的阿姨拿走,幾個無所謂,10來個箱子,夠大伙兒吃頓烤肉了??還有EMC的木箱子??拿去養(yǎng)個小雞小鴨的??
42U機柜1U的服務(wù)器最好是16臺。你就看著上吧。呵呵
四,安裝系統(tǒng)和布線
好了,面對幾千臺服務(wù)器開始裝系統(tǒng),我不知道你會怎么想??
全部是1U服務(wù)器有什么辦法安裝系統(tǒng)?(我們公司窮,買不起刀片;而且電信不配合,要是上刀片,電路你們自己拉線,價錢還是原來的價錢;最重要的??我們公司以人為本,寧愿多養(yǎng)個人也不愿意買個好服務(wù)器讓人失業(yè)),而且不允許GHOST,因為你這是服務(wù)器,不是網(wǎng)吧??GHOST出來的系統(tǒng),我不知道誰用過,爽不。我自己是郁悶郁悶到了,莫名問題的時候,你就知道GHOST還是靠不住的。
其次,我們公司安全部要求:必須得一臺一臺安裝,先安裝光板的系統(tǒng)(比如沒有SP的WIn2000),然后手工打SP4補丁,不能網(wǎng)絡(luò)打補丁。于是我們就光盤堆成山。最扯淡的,為了快,我做了一個補丁共享的服務(wù)器,所有的補丁CP的本地來打。結(jié)果忘記拔網(wǎng)線,導(dǎo)致人家說我們是插了網(wǎng)線打補丁,有中毒的危險,需要重裝。我直接崩潰?? 辦法1,你可以1臺1臺慢慢裝,反正這么多機器,你可以管公司要更多的時間。但是我們公司一般是機器到了,最多2-3天就要要,一向是那種計劃不如變化快的沒有計劃沒有進度管理的“小”公司,項目組拿著雞毛當(dāng)令箭,牛x哄哄的公司。郁悶!
這個時候前期的準備就比較重要了(我公司多用windows2003),因為首先我要裝一個光系統(tǒng),再打驅(qū)動,再打補丁,再安裝遠程控制軟件。一臺機器裝完大約要1小時多點。那么機器多了怎么辦?光盤不夠怎么辦?等等問題就來了。
我的辦法是,我一看TMD全部是DVD,IBM的機器直接佩combo,公司給我們發(fā)的全部是CD,娘的,典型的沒有最慢只有更慢,出了問題閑你慢的領(lǐng)導(dǎo)班子。于是只好自己出錢買了DVD,用軟件把RAID,網(wǎng)卡,顯卡其他驅(qū)動做到光盤里,需要安裝的軟件也直接做成自動安裝的方式,補丁也刻錄到光盤里(我們要求補丁必須單打,不能安裝集成補丁的ISO,shit),這樣弄,你只用把光盤往光驅(qū)里一丟,分區(qū)一分,就可以下一臺機器了。然后等你在去關(guān)注這個機器的時候,已經(jīng)可以設(shè)置IP插網(wǎng)線了。靈感來自番茄花園。吼吼。
當(dāng)然這時候你最好是買個KVM,16口的KVM,一次準備16張光盤就可以用一套鍵盤鼠標(biāo)操作16臺機器。當(dāng)然啦,KVM是可以級聯(lián)的,我最牛一次一次一套鍵盤安裝166臺機器。郁悶的是,塞光盤塞死,插KVM線插死,配置IP配死,有時候還會弄錯??
辦法2,你可以用NETKVM去遠程安裝,但是你插那些NETKVM的線路,2000個插下來,爽不?然后你繼續(xù)扎KVM和網(wǎng)線的時候,看著和瀑布一樣的網(wǎng)線和KVM線交錯在一起。估計直接崩潰。遠程KVM有的牛x的是可以分發(fā)ISO的,就是傳說中的遠程分發(fā)安裝。可以自己買一個研究研究了,我們公司以人為本,從來不買這類高科技。
辦法3,我犯賤時候發(fā)明的:我們的機器全部是RAID1,于是我安裝一臺raid1的機器,系統(tǒng)全部安裝好,然后拔掉一個硬盤,插上一個新硬盤自動恢復(fù)鏡像,基本10來分鐘恢復(fù)好一個硬盤,插到機器上去。這樣,還是比裝系統(tǒng)來的快。當(dāng)然啦,型號是一模一樣的??
辦法4,HP的ILO2功能,實現(xiàn)遠程分發(fā)。前提你得一臺一臺配置好BIOS里的ILO2。也是蠻痛苦的。IBM和DELL現(xiàn)在也都有這個功能,但是你在分發(fā)以前,還是得一臺一臺機器插上網(wǎng)線,配置好BIOS的IP,痛苦。然后把操作系統(tǒng)和機器的驅(qū)動程序和后續(xù)的軟件全部做到一張DVD里,讓他自動運行。然后所有的服務(wù)器遠程運營這一個ISO,最好多弄幾臺,否則一臺機器弄的慢死。
辦法5,絕對最簡單的辦法!!就是買機器前,讓廠家給你在硬盤里灌好系統(tǒng),和你買筆記本一樣,打開是個安裝完成需要你輸入序列號的系統(tǒng)。但是弱點是后續(xù)的軟件需要自己裝。因為服務(wù)器廠商是不會幫你安裝別的軟件的。還有更多的辦法,只是暫時沒想到,大家也可以談?wù)撟约旱霓k法?;ハ嘟涣髀?。(51CTO編輯注:其實現(xiàn)在已經(jīng)有很多無人值守安裝系統(tǒng)的管理軟件,比如KickStart和現(xiàn)在流行的Cobbler,都是不錯的批量安裝工具,而且都是開源的?,F(xiàn)在都追求自動化,希望越來越多的運維們將不必面對一臺一臺裝機的困擾)
所以我喜歡linux,可以用N種辦法安裝系統(tǒng)。
windows就是個讓IT人當(dāng)裝機男,挨踢人當(dāng)民工。
好了系統(tǒng)裝好了,電源線和網(wǎng)線連接完,和瀑布一樣的。這時候還是盡量把他扎一下吧。
否則機器通風(fēng)不暢,會導(dǎo)致熱死。
簡單辦法就是電源線扎一邊,網(wǎng)線扎一邊。有錢的公司可以買個網(wǎng)線序號標(biāo),沒錢就自己拿膠布標(biāo)。
你可以隨便扎,或者和給你老婆梳頭一樣,好好扎。哈哈
插交換機的時候,從上往下,從1-24往后,這樣網(wǎng)絡(luò)異常,數(shù)一下就知道了。
想來想去這里也沒啥值得關(guān)注的地方。所以就幾行帶過。
五,資產(chǎn)統(tǒng)計
假如你的機器只有2000臺反而好容易管理了,但是現(xiàn)在我要管理的全國IDC有31個,平均每個機房有不同品牌服務(wù)器1500臺。
一共大約有45000臺的樣子(我的資產(chǎn)管理系統(tǒng)里的數(shù)字,不包含交換機,防火墻等)
這時候怎么辦?
每季度和財務(wù)小MM一起出去旅游盤點IDC資產(chǎn),幸福啊??(我們財務(wù)小mm很PL的哦)到了機房就是我一個人干活點資產(chǎn),小mm帶著大口罩,披著雙層的放輻射服??
可憐我們這些干活的,短褲背心,IDC里一呆就是好幾個月(IDC辦公室就在機房邊上??),不知道精子被輻射殺死多少??
1,必須有資產(chǎn)管理系統(tǒng),雖然這個其實是個很簡單的數(shù)據(jù)庫,但是你可以把每一臺機器的品牌,硬件信息,操作系統(tǒng)信息,購買年限,質(zhì)保年限等,你非常關(guān)注的東西做一個詳細記錄,并配發(fā)同一的資產(chǎn)編號。比如我們的資產(chǎn)號,F(xiàn)WQ-123456 服務(wù)器-123456,這是一個總的資產(chǎn)號,這個服務(wù)器哪怕搬到美國,也是這1個資產(chǎn),直到丟失,或者拋棄,都是這一個資產(chǎn),永遠不會變。
比如我現(xiàn)在的板凳就是一個資產(chǎn)號是:服務(wù)器-000010的一個4U服務(wù)器,配置是P2 300*2 256M內(nèi)存 16G硬盤×4 購買時間是1999年10月,從中維修過1次,升級過1次,在哈爾濱機房-廣州機房-河南機房-北京網(wǎng)通機房-上海公司內(nèi)部測試機房-上海庫房服役過。
有歷史吧??.2,送到機房
看過我這個服務(wù)器去過的地方,羨慕不?見證我們公司的發(fā)展史。9年過去了,終于成了我的板凳??
服務(wù)器在購買合同確定以后,就應(yīng)該按照配置記錄資產(chǎn),并且在財務(wù)備案,資產(chǎn)編號一定和財務(wù)記錄相同。這樣這個服務(wù)器走到哪里,都有備案和記錄?,F(xiàn)在要把這個服務(wù)器送到某個機房去,搬著走吧??汗
送到機房,我們要給服務(wù)器按照財務(wù)給的表格粘貼資產(chǎn)編號,選個順眼的地方,不會磨損的地方。
一般是機器正面某個地方,然后是機器屁股后面某個地方,然后機器側(cè)面把手的地方,粘貼3個,以防掉了就煩了。
然后在粘貼這個機器的應(yīng)用資產(chǎn)號和IP標(biāo)簽:
應(yīng)用資產(chǎn)號舉例:FWQ-SH-XX-B31-WEBSERVER 意思是:服務(wù)器-上海-xx機房-B列31號機柜-web服務(wù)器
IP標(biāo)簽舉例:外123.234.123.234內(nèi)10.0.0.1。這2個標(biāo)簽?zāi)憧梢苑珠_也可以在一張標(biāo)簽上寫清楚。
并且在安裝服務(wù)器的時候。把FWQ-SH-XX-B31-WEBSERVER-123-234 把這個作為你的HOSTS信息,windows里叫做計算機名
這樣遠程上來都非常清晰自己在哪個服務(wù)器上,出問題時候也非常容易找到這個機器,不要閑麻煩,一切的麻煩都是為了以后快速的解決down機問題而做的。當(dāng)然啦,甚至在密碼管理上你也可以用這個規(guī)則來設(shè)置密碼,但是最好規(guī)則別讓別人知道了??
3,把這些信息全部錄入你的資產(chǎn)管理系統(tǒng)
系統(tǒng)無非服務(wù)器名,IP信息,用途,機架位置,或者是否在使用一類的,我就不多講了
4,資產(chǎn)系統(tǒng)軟件交互,也可以說是監(jiān)控系統(tǒng)。
企業(yè)可以開發(fā)一個軟件,在裝機的時候安裝到服務(wù)器上。然后資產(chǎn)管理系統(tǒng)定時去取服務(wù)器上的信息,比如網(wǎng)絡(luò)流量,CPU內(nèi)存硬盤負載一類的東西,這樣你的資產(chǎn)管理系統(tǒng)又變成了一個監(jiān)控系統(tǒng);
當(dāng)然啦,你也可以在資產(chǎn)系統(tǒng)里集成一個遠程桌面管理系統(tǒng),自動載入用戶名和密碼,還有隨機碼,就可以登錄系統(tǒng)。省的還得管理服務(wù)器密碼。
然后用戶的訪問權(quán)限不同,看到的節(jié)面權(quán)限就不同。
比如說,監(jiān)控人員沒有登錄權(quán)限,或者IDC人員沒有登錄權(quán)限一類。權(quán)限分配你自己研究好了。
5,還是IDC的工作。
話題繼續(xù)回到我和財務(wù)小mm去盤點(你公司比較大的話,你可以多派幾個人分開去各個地方??)
小mm一看我們機房服務(wù)器黑壓壓的一片,鋪天蓋地的,直接無語。為啥,因為要拿著資產(chǎn)表一個一個核對,面對幾千個機器,直接暈倒。
雖然按照資產(chǎn)管理系統(tǒng)里導(dǎo)出的信息,機柜號,IP號,機器從上到下的順序都非常精確,但是你一個一個核對,還是慢。
怎么辦?
庫房管理的工作用上了,哈哈。你買服務(wù)器或者買筆記本電腦的時候有沒有注意到箱子上的條碼?
那個條碼非常清楚的記錄了這個機器的詳細信息。所以黑莓手機或者NOKIA手機(別的我沒用過)都有掃描條碼的功能??好像與主題無關(guān)??
那么剩下的就簡單了。
去買個這種條碼標(biāo)簽的打印機,編輯成自己需要的條碼,一個一個貼好,上面有你所有需要盤點的信息?? 比如我們是從資產(chǎn)到機柜號到服務(wù)器名字到內(nèi)外網(wǎng)IP都要盤點??小崩潰
打印出來貼上去。然后買個掃描槍,和超市那種一樣,不過你要買有存儲功能的,否則你要端著筆記本去掃描,SB了。
然后我和財務(wù)mm本來需要一個人念號碼一個人核對(你要直到在機房里大喊資產(chǎn)號,喊一天的結(jié)果是啥,自己想),現(xiàn)在一個人拿一個掃描槍,按照規(guī)則一個一個掃描。完成后把數(shù)據(jù)導(dǎo)出后重新整理分析。直接和數(shù)據(jù)庫核對(當(dāng)然這個也需要你自己開發(fā)),核對完成生成一張表。
表上寫的非常清楚你哪個機架沒有哪個機器,哪個機器不在特定的位置上,哪個機器缺少??等等
這樣比如說,機器位置不對扣5塊錢工資,機器IP不對扣2塊錢工資,或者??反正扣到最后??這月不給發(fā)工資了,還得倒貼點??哈哈哈
六,監(jiān)控架構(gòu)
監(jiān)控架構(gòu)其實每個地方都有自己的做法,我也知道我的辦法不是很先進,但是仍然拿出來和大家一起討論
首先談?wù)劚O(jiān)控軟件,一說起這個常用的東西MRTG,cacti一類的就都可以用了。只要稍微歸類一下,流量展示看的還是很清楚的。
要是要監(jiān)控服務(wù)一類的,那就只好啟用大名鼎鼎的nagios,和一些牛x人基于這個做的一些別的商業(yè)軟件。
或者就是自己做個腳本去定時探一下,不通了給你發(fā)郵件了啥的,你vim一下nagios的chack_xxx,學(xué)習(xí)一下里頭人家探測的辦法,自己也能搞出來個啥東西,都還是很不錯的了。
作為IDC工程師,我們所要關(guān)注的東西就是個流量了,我們要很清楚某臺65下的某臺35上每個口的應(yīng)用,當(dāng)遭受攻擊或者流量異常的時候,一眼就能知道是怎么回事。我不相信你天天看著10M的流量,某天突然一下給你來個80M,你說這是正常事件吧。哪怕正常,你也找相關(guān)的人確認一下吧,一個100m口跑 80M,估計電信的人都來找你了。
每天看著這些流量圖是很枯燥的事情,那么我們沒事只能想辦法讓他自動報警給我們了,于是EMAIL報警,然后把他發(fā)送到一個有手機提示新郵件的郵箱,你手機就有了。MSN報警,還是不錯的吧,手機報警一類的辦法都是不錯的。這樣你你可以和我一樣放心的去打網(wǎng)游了。這里只談經(jīng)驗,不談詳細的技術(shù),因為我一說我的系統(tǒng)架構(gòu)地球人都知道我是哪個公司的了,雖然已經(jīng)離職,但是咱也有個職業(yè)道德,謝謝。
當(dāng)然了,有些公司是有網(wǎng)絡(luò)監(jiān)控部門的。但是我就一直在想這個問題,所有的數(shù)值都可以用短信報警,你隨時都可以收到信息。用這個部門干啥,讓一群可憐的家伙 8小時一動不動盯著屏幕,公司又在他們電腦上安裝了抓屏軟件,上班事件聊天上網(wǎng)就扣錢??我估計他們每天最期望的事情也莫過于服務(wù)器掛了,可以給我們打個電話重啟個服務(wù)器或者連到服務(wù)器上檢查一下啥問題,重啟個服務(wù)了啥的。當(dāng)然了,這些兄弟最后的職業(yè)方向也只能是進入運維部門了,至少公司服務(wù)器宕機維護的流程性東西掌握的非常熟練了。但是這是用好幾年時間換來的經(jīng)驗,太??所以我是奉勸兄弟們有發(fā)現(xiàn)監(jiān)控部門招聘人,就別去了吧。面前8臺顯示器,猛一看還以為是黑客帝國吶,結(jié)果仔細一看全tmd是流量圖。常年對著8個顯示器,那個輻射??
我就不清楚設(shè)置個節(jié)點,出現(xiàn)問題告訴人,人去操作會死啊,非要讓人和機器一樣一動不動的盯著顯示器,TMD,官僚。雖然我沒經(jīng)歷過,但是想也能想到。做SA,最大的要點是懶,把一些需要人做的事情都自動化??但是話說回來,我公司以人為本,人海戰(zhàn)術(shù)嘛,可以理解。
上面的帖子位子已經(jīng)滿了,下來的帖子在這里寫。
企業(yè)實際面對的一些問題
我大概通讀了veyron 大俠的文章,認為系統(tǒng)架構(gòu)方面的我絕對不如他。我就不在這里賣藝了,那么我賣企業(yè)都會實際面對的一些問題。
1,自動化,流程化你的信息管理
為什么要自動化,這年頭流行辦公自動化,你丫沒事還拿著工單四處簽字,老土了吧。
為什么要流程化,這念頭流行流程管理,假如你公司沒有一個固定的流程管理,出了事情,大家都不知道怎么做,各個部門的電話亂打,大家都一鍋粥沒有效率。所以,未雨綢繆,在沒有出問題的時候,模擬出問題,多多準備,建立規(guī)范的流程,公司的每個人都要遵守,這樣,流程化的管理+辦公自動化,大家只用在電腦上翹翹鍵盤,點擊確定,流程就發(fā)出去,一路審批,OK,流程發(fā)送到做事的人地方,也許這個做事的人在美國,也一樣方便。
上面說的是一個原理和意思,用這樣的理念去管理你的服務(wù)器應(yīng)該如何去做?當(dāng)然了,你假如只有10來臺服務(wù)器,就不用考慮這個了??.首先服務(wù)器采購錄入資產(chǎn)管理系統(tǒng)(詳細見上面有寫),服務(wù)器的去向和調(diào)度都在管理系統(tǒng)里有提現(xiàn)。
這里說的是:如何去上架,維修,下架等流程控制
先說上架下架:服務(wù)器到機房以后,別人要用服務(wù)器怎么辦?先可以到你的資產(chǎn)管理系統(tǒng)里,看你機房還有什么配置的機器多少臺,然后讓他們選擇自己項目服務(wù)器的配置,數(shù)量。在流程管理系統(tǒng)中,把這些機器選中,生成一個表單,表單名字為xx項目上架需求,寫清楚誰用,做什么,數(shù)量,哪個機房等。然后提交給他們部門領(lǐng)導(dǎo),他們部門領(lǐng)導(dǎo)同意后,轉(zhuǎn)給需要審批的領(lǐng)導(dǎo),一層層下來,流轉(zhuǎn)到我們部門領(lǐng)導(dǎo),我們部門領(lǐng)導(dǎo)流轉(zhuǎn)給部門機房員工,員工收到流程,檢查上架下架服務(wù)器;如要上架,安裝完系統(tǒng)后填寫IP,機器名,機架等相關(guān)信息。如要下架,刪除相關(guān)信息,提交給流程控制的人員,流程控制人員確認后,這個流程完成。屆時,所有的人審批過的數(shù)據(jù),經(jīng)手人,數(shù)據(jù)庫里都有,出現(xiàn)什么問題找相關(guān)責(zé)任人,一下就找到了,省的和某些XX部門JJYY。
維修也一樣了,機器壞了,或者需要重裝系統(tǒng),按照上面的流程,一步步走一遍,就可以了。年底統(tǒng)計機房一天要干多少活,省的某些領(lǐng)導(dǎo)認為機房人TMD都在閑著。機房的人呢?沒有流程不干活,否則白干。
在流程系統(tǒng)里重啟服務(wù)器,重啟服務(wù)器要是要流程,就太慢了,那么你可以做一個綠色通道,寫清楚原因,重啟哪個機器,直接提交給相關(guān)機房人員,在你的流程系統(tǒng)里綁定一個短信網(wǎng)關(guān),機房人員可以收到需要重啟服務(wù)器的短信。準確無誤。
這樣代替了無紙化辦公,既有自己做的事情的每一個記錄,又有相關(guān)人員管理,可以量化自己的工作,免得年終獎的時候xx人有說你干的少,發(fā)的少。你把記錄拉出來對比對比就知道誰多誰少了。
2,如何升級你的服務(wù)器
服務(wù)器老了,或者需要加內(nèi)存加硬盤,怎么升級。
雖然說是很簡單換個CPU,加個內(nèi)存,加個硬盤很簡單。
但是,如何控制你的配件不丟失,確定的安裝到機器上利用了呢?
簡單,在服務(wù)器上做一個探測服務(wù)器配置的客戶端,每天探測一次硬件配置發(fā)送到資產(chǎn)管理服務(wù)器上。
與資產(chǎn)管理系統(tǒng)的硬件配置做對比,出了問題就報錯發(fā)一封郵件到機房工作人員,抄送流程控制人員一封就可以了。
至于的加內(nèi)存的時候注意型號啥的問題就不說了,大家應(yīng)該都沒問題了 要說的是,假如你一個機柜上放的機器比較多,比如4個6個機器一摞,恰巧壞了,恰巧一個人在機房,非得解決,怎么辦?
簡單,一個辦法,但是還是需要你有力氣,雖然有力學(xué)原理
比如有4臺服務(wù)器,最下面的壞了,你可以拽住最下面的把4臺一起往出拉,拉出來一點,把上面3臺往后推,這樣一點一點的拉出來,下面最關(guān)鍵:
拉到最后,前面要留出來一點,輕輕的把上面3臺的尾巴著地,然后一只手抬住上面3臺機器,一只手拉出下面一臺機器。
上面3臺一定要留出來一點,否則放下的時候,機器和機柜托板會壓住你的手,你一松手,機器震一下,硬盤就掛了??
所以在推進去的最后仍舊要留一點在外面,最后放下來了再推進去這最后一點。
然后就可以換或者加內(nèi)存了。相對比較省勁,不危險,不會壓倒自己,不會砸壞服務(wù)器的辦法就是這樣了。