日日操夜夜添-日日操影院-日日草夜夜操-日日干干-精品一区二区三区波多野结衣-精品一区二区三区高清免费不卡

公告:魔扣目錄網為廣大站長提供免費收錄網站服務,提交前請做好本站友鏈:【 網站目錄:http://www.ylptlb.cn 】, 免友鏈快審服務(50元/站),

點擊這里在線咨詢客服
新站提交
  • 網站:51998
  • 待審:31
  • 小程序:12
  • 文章:1030137
  • 會員:747

在數據成為新石油的今天,了解數據科學職業的細微差別比以往任何時候都更加重要。無論你是正在尋找機會的數據愛好者,還是資深數據專家,使用SQL都可以讓你深入了解數據科學就業市場。

本文可以帶你了解哪些數據科學職位最具吸引力,或者哪些職位能夠提供最高薪水。或許,你還想知道經驗水平如何與數據科學的平均工資掛鉤?

在本文中,將深入研究數據科學就業市場,從而解答所有這些問題(以及更多問題)。跟隨本文開始了解吧!

數據集薪資趨勢

本文將使用的數據集旨在揭示2021年至2023年期間數據科學領域的薪資模式。通過重點關注工作歷史、工作職位以及公司地點等因素,該數據集為了解該行業的工資分布情況提供了重要依據。

本文將為以下問題找到答案:

  1. 不同經驗水平的平均工資是什么樣的?
  2. 數據科學領域中最常見的職位名稱是什么?
  3. 薪資分布如何隨公司規模變化?
  4. 數據科學崗位主要位于哪些地理位置?
  5. 數據科學中哪些職位提供薪酬最高?

可以從Kaggle下載這些數據。

【數據集】:https://www.kaggle.com/code/zabihullah18/data-science-salary-trend

1. 不同經驗水平的平均工資是什么樣的?

在這個SQL查詢中,本文正在找出不同經驗水平的平均工資。GROUP BY子句按經驗水平對數據進行分組,AVG函數計算每個組的平均工資。

這有助于了解該領域的經驗如何影響收入潛力,這對規劃數據科學的職業道路至關重要。接下來查看一下代碼。

SELECT experience_level, AVG(salary_in_usd) AS avg_salary
FROM salary_data
GROUP BY experience_level;

現在,本文使用Python/ target=_blank class=infotextkey>Python可視化這個輸出。

以下是代碼。

# 導入繪圖所需的庫
import matplotlib.pyplot as plt
import seaborn as sns
# 設置圖表樣式
sns.set(style="whitegrid")

# 初始化用于存儲圖形的列表
graphs = []

plt.figure(figsize=(10, 6))
sns.barplot(x='experience_level', y='salary_in_usd', data=df, estimator=lambda x: sum(x) / len(x))
plt.title('Average Salary by Experience Level')
plt.xlabel('Experience Level')
plt.ylabel('Average Salary (USD)')
plt.xticks(rotation=45)
graphs.Append(plt.gcf())
plt.show()

現在,本文來比較一下入門級和資深級、中級和高級的工資。

首先從入門級和資深級的開始。以下是代碼。

# 篩選入門級和資深級的數據
entry_experienced = df[df['experience_level'].isin(['Entry_Level', 'Experienced'])]

# 篩選中級和高級數據
mid_senior = df[df['experience_level'].isin(['Mid-Level', 'Senior'])]

# 繪制入門級與資深級的對比圖表
plt.figure(figsize=(10, 6))
sns.barplot(x='experience_level', y='salary_in_usd', data=entry_experienced, estimator=lambda x: sum(x) / len(x) if len(x) != 0 else 0)
plt.title('Average Salary: Entry_Level vs Experienced')
plt.xlabel('Experience Level')
plt.ylabel('Average Salary (USD)')
plt.xticks(rotation=45)
graphs.append(plt.gcf())
plt.show()

這是生成的圖表。

現在,本文來繪制中級和高級的工資。以下是代碼。

# 繪制中級和高級的圖表
plt.figure(figsize=(10, 6))
sns.barplot(x='experience_level', y='salary_in_usd', data=mid_senior, estimator=lambda x: sum(x) / len(x) if len(x) != 0 else 0)
plt.title('Average Salary: Mid-Level vs Senior')
plt.xlabel('Experience Level')
plt.ylabel('Average Salary (USD)')
plt.xticks(rotation=45)
graphs.append(plt.gcf())
plt.show()

2. 數據科學領域中最常見的職位名稱是什么?

在這里,本文將提取數據科學領域中前10個最常見的職位名稱。COUNT函數會統計每個職位名稱的出現次數,并按降序排列結果,從而將最常見的職位名稱排在最前面。

通過這些信息,可以了解就業市場的需求情況,從而確定自己可以瞄準的潛在職位目標。接下來查看一下代碼。

SELECT job_title, COUNT(*) AS job_count
FROM salary_data
GROUP BY job_title
ORDER BY job_count DESC
LIMIT 10;

好的,現在使用Python來可視化這個查詢。

以下是代碼。

plt.figure(figsize=(12, 8))
sns.countplot(y='job_title', data=df, order=df['job_title'].value_counts().index[:10])
plt.title('Most Common Job Titles in Data Science')
plt.xlabel('Job Count')
plt.ylabel('Job Title')
graphs.append(plt.gcf())
plt.show()

接下來看看圖表。

3. 薪資分布如何隨公司規模變化?

在這個查詢中,本文提取了每個公司規模分組的平均薪資、最低薪資和最高薪資。使用AVGMINMAX等聚合函數有助于全面了解薪資情況與公司規模的關系。

這些數據非常重要,因為它們可以幫助你了解可以期望的潛在收入,這取決于你想要加入的公司的規模。接下來查看一下代碼。

SELECT company_size, AVG(salary_in_usd) AS avg_salary, MIN(salary_in_usd) AS min_salary, MAX(salary_in_usd) AS max_salary
FROM salary_data
GROUP BY company_size;

現在,本文將使用Python來可視化這個查詢。

以下是代碼。

plt.figure(figsize=(12, 8))
sns.barplot(x='company_size', y='salary_in_usd', data=df, estimator=lambda x: sum(x) / len(x) if len(x) != 0 else 0, order=['Small', 'Medium', 'Large'])
plt.title('Salary Distribution by Company Size')
plt.xlabel('Company Size')
plt.ylabel('Average Salary (USD)')
plt.xticks(rotation=45)
graphs.append(plt.gcf())
plt.show()

以下是輸出結果。

4. 數據科學崗位主要位于哪些地理位置?

在這里,本文確定了擁有最多數據科學職位機會的前10個地點。本文使用COUNT函數來確定每個地點的職位發布數量,并按降序排列,以突出顯示機會最多的地區。

掌握了這些信息,可以幫助讀者了解數據科學職位的中心地理區域,有助于做出潛在的遷移決定。接下來查看一下代碼。

SELECT company_location, COUNT(*) AS job_count
FROM salary_data
GROUP BY company_location
ORDER BY job_count DESC
LIMIT 10;

現在,本文將使用Python來繪制上述代碼的圖表。

plt.figure(figsize=(12, 8))
sns.countplot(y='company_location', data=df, order=df['company_location'].value_counts().index[:10])
plt.title('Geographical Distribution of Data Science Jobs')
plt.xlabel('Job Count')
plt.ylabel('Company Location')
graphs.append(plt.gcf())
plt.show()

請查看如下所示的圖表。

5. 數據科學領域中哪些職位提供薪酬最高?

在這里,本文確定了數據科學領域中薪資最高的前10個職位頭銜。通過使用AVG,本文計算出每個職位頭銜的平均薪資,并根據平均薪資的降序排序,以突出顯示最賺錢的職位。

通過查看這些數據,可以在自己的職業道路上有所追求。接下來繼續了解讀者如何為這些數據創建Python可視化。

SELECT job_title, AVG(salary_in_usd) AS avg_salary
FROM salary_data
GROUP BY job_title
ORDER BY avg_salary DESC
LIMIT 10;

以下是輸出結果。

排名 職位頭銜 平均薪資(美元)
1 數據科學技術主管 375,000.00
2 云數據架構師 250,000.00
3 數據主管 212,500.00
4 數據分析主管 211,254.50
5 首席數據科學家 198,171.13
6 數據科學總監 195,140.73
7 首席數據工程師 192,500.00
8 機器學習軟件工程師 192,420.00
9 數據科學經理 191,278.78
10 應用科學家 190,264.48

這次,讀者可以嘗試自己創建一個圖表。

提示:可以使用以下ChatGPT中的提示來生成此圖形的Pythonic代碼:

<SQL Query here>

Create a Python graph to visualize the top 10 highest-paying job titles in Data Science, similar to the insights gathered from the given SQL query above.

# <SQL查詢代碼>

# 創建一個Python圖形來可視化數據科學領域中薪資最高的前10個職位頭銜,類似于上述給定SQL查詢所得到的見解。

結語

跟隨本文結束對數據科學職業世界的多種探索,希望SQL能成為一個可靠的指南,幫助你發掘出有關支持職業決策的見解。

分享到:
標簽:SQL
用戶無頭像

網友整理

注冊時間:

網站:5 個   小程序:0 個  文章:12 篇

  • 51998

    網站

  • 12

    小程序

  • 1030137

    文章

  • 747

    會員

趕快注冊賬號,推廣您的網站吧!
最新入駐小程序

數獨大挑戰2018-06-03

數獨一種數學游戲,玩家需要根據9

答題星2018-06-03

您可以通過答題星輕松地創建試卷

全階人生考試2018-06-03

各種考試題,題庫,初中,高中,大學四六

運動步數有氧達人2018-06-03

記錄運動步數,積累氧氣值。還可偷

每日養生app2018-06-03

每日養生,天天健康

體育訓練成績評定2018-06-03

通用課目體育訓練成績評定