現(xiàn)在云服務(wù)已經(jīng)深入千家萬戶了,不僅商用,私用也很多。很多云服務(wù)廠商也都有配套的服務(wù)器安全模塊,可以檢測(cè)網(wǎng)絡(luò)流量異常、內(nèi)存占用量和CPU占用率,并且允許人工設(shè)置告警閾值。例如,CPU持續(xù)大于90%10分鐘,那么你可能就會(huì)收到一條告警通知。
有時(shí),或許這樣的告警是因?yàn)橐恍阂庑袨榛蛘遙ug導(dǎo)致。但是有時(shí),我們希望我們編寫的程序能夠盡可能壓榨性能去盡快處理一些工作,此時(shí)CPU占滿或許是一個(gè)很正常的行為。可如此就會(huì)觸發(fā)告警,加之一些同道告警強(qiáng)迫癥發(fā)作,此時(shí)就會(huì)很為難。如果增加一些sleep操作,莫名其妙的睡眠似乎總是不夠優(yōu)雅與完美。
那么,有沒有什么好的解決方案呢?
今天碼哥就給大家提供一種解決方案。

或許有些人聽過用過Docker,docker容器就是可以做到資源隔離與資源配額的。似乎是我們想要的,那么是否可以借鑒一下呢?
答案是肯定的。
很多時(shí)候,我們的程序只是一次性的任務(wù),且有些任務(wù)還依賴一些框架,如果將這種任務(wù)裝入docker容器運(yùn)行,顯然成本和收益的問題讓我們內(nèi)心不太通達(dá)。
在linux中,這樣的資源配額限制是通過cgroups來實(shí)現(xiàn)的,它能夠限制CPU、內(nèi)存、IO等資源的使用程度。當(dāng)然cgroups還有一些其他的使用功能,這里就不額外延展啦。
為了應(yīng)對(duì)上面的那種資源限制需求,碼哥展示一個(gè)用C語言編寫的啟動(dòng)程序,幫你輕松解決這類問題。

限于篇幅,我們只展示CPU限制的方式,內(nèi)存和IO相關(guān)的限制方法與其類似,可參閱網(wǎng)上一些人的文章自行擴(kuò)展。
下面直接上代碼(受限于手機(jī)屏幕尺寸,建議大家PC端查看):
/*
* Author: 碼哥比特
*/
#define _GNU_SOURCE
#include <stdio.h>
#include <sys/types.h>
#include <unistd.h>
#include <fcntl.h>
#include <sys/mount.h>
#include <sched.h>
#include <errno.h>
#include <string.h>
#include <dirent.h>
#include <stdlib.h>
#include <sys/stat.h>
char *cpu = NULL;
char *group_name = NULL;
char cpu_basedir[256];
int deleted = 0;
static void print_help(char *name)
{
printf("Usage:n");
printf("%s [OPTIONS] SHELL COMMANDn", name);
printf("t-cttset cpu raten");
printf("t-gttgroup namen");
printf("t-dttdelete groupn");
}
static int parse_args(int argc, char *argv[])
{
//...掠過一些參數(shù)解析部分
}
static void set_limit(void)
{
int fd, n, pid = getpid();
char tmp[1024];
if (cpu != NULL) {
if (mkdir(cpu_basedir, S_IRWXU) < 0) {
if (errno != EEXIST) {
fprintf(stderr, "create cpu group failed");
exit(1);
}
}
memset(tmp, 0, sizeof(tmp));
snprintf(tmp, sizeof(tmp)-1, "%s/cpu.cfs_quota_us", cpu_basedir);
if ((fd = open(tmp, O_WRONLY)) < 0) {
fprintf(stderr, "open cpu file failed. %sn", strerror(errno));
exit(1);
}
memset(tmp, 0, sizeof(tmp));
n = snprintf(tmp, sizeof(tmp)-1, "%sn", cpu);
write(fd, tmp, n);
close(fd);
memset(tmp, 0, sizeof(tmp));
snprintf(tmp, sizeof(tmp)-1, "%s/tasks", cpu_basedir);
if ((fd = open(tmp, O_WRONLY|O_AppEND)) < 0) {
fprintf(stderr, "open cpu tasks failed. %sn", strerror(errno));
exit(1);
}
memset(tmp, 0, sizeof(tmp));
n = snprintf(tmp, sizeof(tmp)-1, "%dn", pid);
write(fd, tmp, n);
close(fd);
}
}
int main(int argc, char *argv[])
{
int idx = parse_args(argc, argv);
if (group_name == NULL) {
fprintf(stderr, "group name must be givenn");
print_help(argv[0]);
exit(1);
}
memset(cpu_basedir, 0, sizeof(cpu_basedir));
snprintf(cpu_basedir, sizeof(cpu_basedir)-1, "/sys/fs/cgroup/cpu/%s", group_name);
if (deleted) {
remove(cpu_basedir);
}
if (idx) {
set_limit();
execv(argv[idx], argv+idx);
}
return 0;
}
為了節(jié)省篇幅,代碼中略過了一些參數(shù)解析部分。從幫助信息中,我們也可大致看到程序的使用方式。
# ./cpuctl -c=89000 -g=test_group a.out #姑且先叫cpuctl吧
這里,-g是用來設(shè)置資源組名的,避免和其他資源組沖突。-c是這個(gè)資源組下的所有進(jìn)程CPU占用總和的上限數(shù)值,89000是89%的含義。這里要注意,如果你有兩個(gè)進(jìn)程在這個(gè)資源組下,那么兩個(gè)進(jìn)程是平分89%的,也就是每個(gè)進(jìn)程44.5%。a.out則是我們要執(zhí)行的程序。
我們用一個(gè)簡(jiǎn)單的死循環(huán)來測(cè)試一下:
#include <stdio.h>
int main(void)
{
while (1) {}
return 0;
}
正常情況下100%無疑,如圖:

CPU100%
下面我們用我們的程序啟動(dòng)器來啟動(dòng)a.out并限制其CPU為89%,如圖:

CPU 89%
我們可以看到,其CPU占比會(huì)在89%上下小幅浮動(dòng),大家可自行嘗試。
從代碼中,我們可以看到,其實(shí)限制的方法是在/sys/fs/cgroup/cpu下建立一個(gè)test_group目錄,然后向其內(nèi)的cfs_quota_us文件寫入限制額度,再向其內(nèi)的tasks寫入希望限制的進(jìn)程ID。目前從碼哥的使用情況來看,阿里和騰訊的cgroups配置都是在/sys/fs/cgroup中的,可能其他的操作系統(tǒng)有不同的路徑。
喜歡的朋友可以關(guān)注碼哥,也可以在評(píng)論區(qū)給碼哥留言交流,謝謝觀看!