當前位置: 妍妍網 > 碼農

運維經理私藏的28條運維保命秘訣

2024-03-19碼農

1

從買網域名稱開始,要買多個網域名稱,50個甚至100個。分為主網域名稱和推廣網域名稱(給推廣連結用的)。要從godaddy上買網域名稱,因為這裏的網域名稱穩定,不會出現被攻擊等事情。同時還要買網域名稱保護,這樣互聯網使用者ping這個網域名稱就解析不到真實的伺服器地址。同時網域名稱解析的操作不要在godaddy上進行,要把解析的操作放在cloudflare上或者dnspod上進行操作,也可以放到zndns上(這個dns可以做到一個網域名稱解析多個IP地址,根據就近原則,把最快的IP地址解析給使用者。)也可以自己搭建dns伺服器,在godaddy上只想到自己搭建的dns伺服器就可以了。這樣,修改dns指向的時候會更快。

2

Cdn,一定要買cdn服務。如果出現部份使用者存取不了就使用cdn服務。可以從cloudflare上購買cdn服務,這樣網域名稱解析到cdn上,然後cdn解析到肉盾擊還是那個,然後肉盾擊指向核心伺服器上。Cdn充當一個緩存和轉發的作用,大流量攻擊的時候他可以防禦至少200G的攻擊。Cdn是全球緩存的。

3

圖片伺服器,在國內租用幾台伺服器做圖片緩存伺服器即可,這樣提高存取速度。其實nginx本身就是一個圖片緩存伺服器。

4

機房:選擇機房太重要了,一般來說使用者在哪裏,機房就要選擇哪裏,因為這樣才最快。但是美國的伺服器頻寬很大,如果是需要大頻寬的只能美國。買伺服器之前一定要測試ping值,可以用chinaz工具,測試全國到這台伺服器的ping值。要服務品質好的,還要高防好的,還要可靠性高的,還要相應及時的,還要能隨時可以檢視伺服器狀態的,最重要還要服務態度好了。機房要買香港九河(使用者核心伺服器),美國聖安娜機房(用於肉盾擊)(雖然慢,但是安全高防做的真好,大流量攻擊的時候,這裏的機房還是可以存取,所以,雞蛋不要放在一個籃子裏頭,要各個等級都有才叫好的,國內機房快,但是高防效果差,美國機房慢但是高防效果好)

5

一個主頁,就是招商或成為打廣告的網站,可以租用雲主機,這樣被打死就被打死吧。裏面可以有一個連結,指向遊戲首頁,這個連結可以是帶埠號的,那就簡單了。也可以是不帶埠號的,這時候就一定要用cdn伺服器,或者使用免備案機房,把肉盾擊放在免備案機房,因為國內搭建網站都是要備案的,博彩這個行業是被禁止的,為了避免網域名稱或者IP地址被和諧了(gwf)所以要用免備案機房。或者就把肉盾擊也放到香港或者台灣或者南韓等等機房。這樣使用者可以不使用埠號,直接用網域名稱就可以存取咱們的網站。

6

一個網站要有監控系統,即時監控伺服器是否有攻擊,功過檢視日誌是否激增,還要把日誌放到日誌伺服器上(syslog服務),使用cacti服務可以把日誌放到cacti上。網速是一定要檢視的,網速激增則證明一定是有攻擊。每天要看日誌,要用日誌分析軟體,看看存取源是單一存取源還是多個不同的存取源.監控伺服器要有報警功能,一旦情況異常就要立刻報警,然後起床處理攻擊。

7

攻擊一般看情況而定,一般的攻擊都是直接攻擊網域名稱。小量的攻擊可以透過nginx和iptables本身的防禦功能就防掉。大量的攻擊由於直接把網路頻寬占用滿了,伺服器無法正常相應,只能依靠機房的高防了。所以要買大量的高防,建議至少200G。如果攻擊源是單一IP或者幾個IP,那麽就讓機房把這幾個IP給遮蔽就可以了。遇到cc或者ddos攻擊,只能靠機房解決。一台伺服器被打死後,需要立刻把網域名稱指向另一台伺服器,(或者直接把網域名稱指向百度)。大量的攻擊還要使用cdn,讓cdn直接指向核心伺服器就可以了,這樣能快一點,讓使用者還可以玩。總之大流量攻擊是不能完全防止的。

8

一個網站一定要有冗余,比如現在是1000人同時存取的並行量,一定要讓網站的負載達到2000人的並行量,要不然一搞活動,網站負載不了那麽多人就完了。

9

伺服器的配置,要用三網卡,一個用於使用者連線,對外的存取(要好的網卡)。一個用於內網伺服器之間的存取使用。一個用於ssh管理,這樣大量攻擊的時候咱們還可以操作伺服器。每個網卡還要多個IP地址,這樣防止某個IP被遮蔽了。國內網路和國外網路經常會有IP不好用的情況。硬碟至少要映像(raid 1),cpu要兩路的,雙電源,總之不要有單點故障。至於肉盾擊的配置可以低一些,甚至桌上型電腦的配置都可以,但是網路一定要好,尤其是和核心伺服器之間的網路一定要好。

10

資料庫要做主從復制,要有異地備份,nginx伺服器要做集群,就是upstream。前台(提供使用者存取頁面)和後台(員工管理界面)要用兩台不同的機器,不要互相影響。其余的服務可以使用一台虛擬機器完成。這樣可以省錢,信箱直接買google的gmail企業信箱就好了,非常好用,最好沒人一個。或者公司內部搭建自己的聊天軟體(最好還錢買聊天軟體)。

11

測試環境要三套,開發人員電腦上自己的環境,要區域網路一套測試環境,互聯網一套測試環境,生產環境。區域網路的測試環境一定要穩定,可以買一個機櫃等等的網路裝置放在一起,不要用普通電腦。區域網路要有svn或git的程式碼管理工具。充分測試後在上傳到生產環境。

12

肉盾擊和核心伺服器之間一定要可以使用ping命令,這樣可以看看那個IP地址不能使用了,網路環通度都可以看出來。

13

運維人員至少兩個,如果有運維經理一個運維人員就夠了。這樣所有運維工作必須有操作文件,兩個人互相協調工作,不需要倒班,但是24小時待命。網管一個就夠了。

14

普通的運維部門大概就這樣,如果是大的網路架構,會有自己的數據中心機房到時候在安排人手。

15

Linux系統要有最佳化和安全配置,比如說nginx基於cpu的最佳化,每個程式基於cpu和記憶體的限制。

16

所有密碼要3個月就修改一次,尤其是網域名稱的帳號和信箱密碼,網域名稱是最重要也是最脆弱的環節。

17

區域網路一定要穩定,可以買兩條網線,至少10M頻寬,還要買一個移動wifi,給員工手機上網。

18

如果是大型網路架構,那得有自己的核心機房,就不是租用機房了,每個崗位都是若幹人組成的,包括運維工程師,資料庫管理工程師,網路工程師,安全工程師,儲存備份系統工程師,運維經歷負責協調各個部門間的工作。目前就是一個運維就能完成所有的工作。

19

運維的工具要統一,比如連線資料庫使用sqlyog工具,連線伺服器使用crt工具,密碼管理用keepass,上傳伺服器程式碼使用winscp工具,等等。這樣運維人員之間工作比較好協調。另外運維一定要有大量時間學習,每天都要上網找新技術,好的資料,最好要懂英文,因為好的技術文件都是英文寫的。這樣對運維工作很有幫助,而且運維技術實力會有很大的進步的,為迎接更大的需求做準備。

20

最後一定要有預案,就是伺服器一旦出現重大問題,就是解決不了了,這個時候就不要去解決這台伺服器,使用預案,把啟用備用方案,盡快讓網站可用。平時多做預案演習,還要多做備份的還原操作,因為有的備份不可用,這是常見現象。別到關鍵時刻備份不能用,整個網站就完了。

21

伺服器安全要有一整套的安全配置,包括使用者安全,套用安全,系統安全,檔安全等。這樣防止伺服器被黑客侵入。

22

一定要做高並行測試,模擬同時線上使用者2000人,看伺服器的負載情況,要有伺服器高並行配置,網路方面是機房的事情,但是得選擇最合適的IP地址,最適合的機房,及出口頻寬。高並行是伺服器架構的事情,不是單單一台伺服器的事情。該花錢的地方一定要花,可以省錢的地方要知道怎麽省錢。

23

運維所有資訊兩個人共享,包括密碼和伺服器配置步驟,由運維經理帶領團隊,打造成一個互相學習,技術實力雄厚,目標一致的和諧團隊。讓每個人在團隊中都得到自己想要的。運維經理的為人就很重要,要不然留不住人,大家心不往一起使勁。運維工作技術不是最重要的,因為這個職位現學現用也來得及,所以工作態度/為人和經驗是最重要的。

24

對伺服器建立日誌,所有伺服器的所有操作都要有記錄,並且寫清時間操作內容。對生產伺服器操作之前一定要做風險評估及解決方案。

25

運維之道:網站可用性/監控與報警/容量規劃/流程規範/知識管理與積累/自動化管理。

26

套用上線後,運維工作才剛開始,具體工作可能包括:升級版本上線工作、服務監控、套用狀態統計、日常服務狀態巡檢、突發故障處理、服務日常變更調整、集群管理、服務效能評估最佳化、資料庫管理最佳化、隨著套用PV增減進行套用架構的伸縮、安全、運維開發工作。

27

圖片伺服器和其他伺服器要分開,肉盾擊可做圖片緩存。

28

檢視了連線數和當前的連線數,分別是 netstat -ant | grep $ip:80 | wc -l netstat -ant | grep $ip:80 | grep EST | wc -l


作者丨ChinaUnix

來源丨網址:http://blog.chinaunix.net/uid-15866552-id-5749921.html

dbaplus社群歡迎廣大技術人員投稿,投稿信箱: [email protected]