友快網

導航選單

資料分析師的常用句子:一個有用的同事如何使用資料分析?

作為一名資料分析師,我整天編寫SQL查詢。我的任務之一是充當公司資料庫和需要隨時使用資料的同事之間的翻譯。根據他們的需求定製提取的資料後,他們就能夠進行自己的分析並得出面向業務的結論。與對資料一無所知的同事一起工作,我發現擁有SQL的基本知識——或者在工作中獲得它——通常會讓他們受益。

如果你處於類似的職位,比如與負責公司資料庫的資料分析師或技術團隊打交道,或者如果你認識這樣的人並且想更多地瞭解SQL是什麼,以及為什麼它在資料處理中如此重要,那麼本文就是為您準備的。

SQL簡介

SQL代表結構化查詢語言。它是一種用於管理儲存在關係資料庫管理系統(RDBMS)中的資料的程式語言。在本文中,我將重點關注查詢,這是SQL中最常見的操作。他們的職責是翻譯諸如“您能告訴我昨天與該客戶進行的交易嗎?”之類的說明。 提取(可能非常大)資料庫的摘錄。

這裡有一個例子。假設我的公司的資料庫由5個表組成:

“交易表”記錄了我公司每天所做的所有交易

“衛生產品表”和“食品產品表”列出了我們銷售的產品

“個人客戶表”和“專業客戶表”是客戶登記冊

要回答“傑克在2020年11月買了什麼?”我需要透過組合這五個表來找到必要的資訊。

那麼,為什麼要學習SQL呢?

在資料分析中變得更加自主

雖然使用Microsoft Excel或谷歌Sheets就足以處理有限的資料,但也許您已經遇到過這樣的情況:由於處理的資料量過大,電子表格軟體假死了。事實上,SQL的第一個優點是,它可以從資料庫中提取和操作大量資料,而不必逐個開啟Excel表來瀏覽資料庫。

回到上一個例子,你將有兩個選項來回答這個問題:

轉到每個表並檢視可用的欄位。要專門查詢Jack和他購買的物品,您需要過濾這些表中的提取內容,以查詢Jack對應的client_id,以及他購買的物品對應的產品。

編寫一個SQL查詢(或使用您喜歡的資料分析師編寫的模板)來直接將所有5個表連線在一起。然後在WHERE子句中指定搜尋條件。

這裡的SQL查詢看起來像這樣:

SELECT

*

FROM transactions AS t

LEFT JOIN hygiene_products AS hp

ON t。product_id = hp。product_id

LEFT JOIN food_products AS fp

ON t。product_id = fp。product_id

LEFT JOIN indiv_customers AS ic

ON t。client_id = ic。client_id

LEFT JOIN prof_customers AS pc

ON t。client_id = pc。client_id

WHERE (ic。client_name = ‘Jack’ OR pc。client_name = ‘Jack’)

AND t。purchase_date BETWEEN ‘2020-11-01’ AND ‘2020-11-30’

更好地組織你的思想

即使您自己不打算成為一名資料分析師,學習SQL也是一個很好的練習,可以更好地理解您公司的資料是如何結構化的,以及透過組合各種資料來源可以實現什麼。SQL具有相當簡單的結構(至少與其他程式語言相比),但它可以執行復雜的查詢。透過自己編寫查詢,您將能夠檢索到更多的資訊,最重要的是,這些資訊將以一種您可以立即使用來回答問題的方式進行結構化。

在與資料分析師或技術團隊的互動中,更好地理解資料庫的架構,更好地理解SQL查詢背後的邏輯,將使您節省寶貴的時間。在表示對資料提取的特定需求時,如果您已經知道需要什麼型別的資料,那麼您將贏得時間。

使用我前面的例子,有兩種方法可以讓你的同事檢索你分析所需的資料:

“我需要一個Jack的資訊,他在2020年11月買了一些產品,你能把他所有的購買清單發給我嗎?”

“我需要個人客戶Jack的資訊,他在2020年11月購買了衛生產品,你能給我一份他的購買清單嗎?”

你可以想象第二個選擇可能會幫助你的同事更快地找到答案。為了說明我的例子,這是你得到這個答案的思維過程:

培養新的專業技能

根據Stack Overflow在2020年進行的一項調查,SQL是第三大最常用的程式語言。也就是說,SQL已經得到了廣泛的傳播,而且它很可能會繼續傳播,因為它是資料庫管理的頭號語言。無論你的公司使用的資料庫技術(MySQL, PostgreSQL, Microsoft SQL Server…),他們都使用SQL或這種語言的衍生。

正如Dataquest所解釋的那樣,根據2021年1月在Indeed求職入口網站上進行的一項分析,SQL是資料類職位最受歡迎的技能。即使你不打算將職業重心轉向全職的資料工作,更好地瞭解這些工作背後的內容也只會對你有所幫助——這為未來在資料領域或其他領域的機會打開了一扇門。

總結:讓我們開始吧!

作為本文的結尾,我想新增最後一個引數(也是一些好訊息):學習SQL是免費的。

其中,MySQL是一個開源的RDBMS,可以免費下載和安裝。然後,你可以從線上課程開始——或者讓你的資料分析師同事給你一個關於這個主題的快速入門課程!

作者:Marie Lefevre

deephub翻譯組

上一篇:央行:3月份金融市場交易量環比下降15.91%地方政府發行4771億元
下一篇:mediatek與愛立信成功完成5g nr雙連線測試,助力全球5g網路部署部署