Vào thẳng nội dung chính

Database SQL and Data Collection for Data Science
Chỉ có thể ghi danh vào khóa học này qua thư mời.

Dành cho học viên đăng ký khóa học MDS4 (Database SQL and Data Collection for Data Science) online.
Chỉ có thể ghi danh vào khóa học này qua thư mời.

Database SQL and Data Collection for Data Science

  • Khóa học cung cấp cho học viên (HV) các kiến thức và kỹ năng cần thiết khi làm việc với cơ sở dữ liệu (database)
  • Trang bị cho HV những kiến thức nền tảng vững chắc về ngôn ngữ truy vấn (SQL): các loại truy vấn rút trích, thêm, xóa, cập nhật dữ liệu trong môi trường Data Science.
  • Hướng dẫn HV cách xây dựng và làm việc với CSDL trên Cloud (đám mây), truy cập CSDL với Python sử dụng DB-API
  • Cung cấp cho HV kiến thức phân tích dữ liệu với Python
  • Cung cấp cho HV kỹ năng thao tác với các loại database thông dụng như MySQL, Sqlite, MariaDB, PostgreSQL, …
  • Trang bị cho HV kỹ năng sử dụng FugueSQL để truy vấn và trực quan dữ liệu, làm nền tảng cho việc thao tác với dữ liệu lớn (Big Data)
  • Trang bị cho HV kỹ năng thu thập dữ liệu từ Internet (Web Scraping)
  • Là khóa học thứ tư của chương trình “Data Science Certificate

Sẽ rất hữu ích nếu bạn là:

Bạn sẽ nhận được gì qua khóa học?

Sau khi hoàn thành khóa học, học viên sẽ đạt được các kỹ năng:
  • Áp dụng kiến thức về ngôn ngữ SQL trong việc sắp xếp và rút trích thông tin từ CSDL
  • Thực hiện các truy vấn có chọn lọc, nhóm, thống kê dữ liệu
  • Cập nhật dữ liệu trên bảng như thêm, xóa, cập nhật
  • Làm việc với các loại CSDL phổ biến như: MySQL, Sqlite, MariaDB, PostgreSQL, …
  • Thu thập dữ liệu từ Internet (Web Scraping)
  • Làm việc với CSDL trên Cloud
  • Làm việc với cơ sở dữ liệu thực, công cụ khoa học dữ liệu thực và bộ dữ liệu trong thế giới thực

Bạn sẽ học những gì?

  • Database
    • Giới thiệu Database
    • Phân biệt DDL (Data Definition Language) và DML (Data Manipulation Language)
    • Tạo Database instance trên Cloud/máy tính
  • Basic SQL
    • SELECT
    • COUNT/DISTINCT/LIMIT
    • WHERE AND/OR/BETWEEN/IN
    • String Patterns (%), Ranges
    • ORDER BY
    • GROUP BY, HAVING
  • Advanced SQL
    • Built-in Function, Date, Timestamps
    • Sub-query, Nested-select
    • Multiple table: dùng sub-query, implicit JOIN, JOIN operators (INNER JOIN, OUTER JOIN)
    • Sử dụng operations để làm việc với multiple tables: INNER JOIN, LEFT OUTER JOIN, RIGHT OUTER JOIN
    • UNION
    • Các hàm cửa sổ trong truy vấn SQL
    • Pattern Matching
    • CTE và View
  • Truy cập Database với Python
    • Python và DB
      • Ưu điểm của Python khi làm việc với DB
      • Mô hình truy cập
      • SQL API
      • API của các SQL-Based DBMS system
    • Sử dụng DB API
      • Khái niệm DB-API
      • Khái niệm Python DB-API: Connection Ojbect, Cursor Object
      • Connection method
      • Cusor method
      • Khái niệm DB cursor
      • Sử dụng DB-API
    • Python code tạo table, tải dữ liệu và truy vấn dữ liệu
      • CREATE, INSERT, QUERY
      • Sử dụng pandas nhận dữ liệu từ table thông qua ipython-sql
      • Sử dụng Python Variables trong SQL Statements
  • SQLite & PostgreSQL
    • Tải csv file vào database warehouse trên cloud
    • Làm việc với SQLite/PostgreSQL
  • Truy vấn dữ liệu với FugueSQL
    • Cài đặt và cấu hình FugueSQL
    • Cú pháp và các hàm sử dụng trong FugueSQL
    • Truy vấn dữ liệu từ các tập tin dữ liệu và các đối tượng như DataFrame, List…
    • Kết xuất và trực quan hóa dữ liệu từ FugueSQL
  • Thu thập dữ liệu từ Internet (Web Scraping)
    • Selenium
    • Scrapy
    • Beautifulsoup

Bằng cấp - Chứng chỉ

Học viên thi đạt kết quả cuối môn học sẽ được cấp chứng nhận "Database SQL and Data Collection for Data Science" do Trung Tâm Tin Học - Trường ĐH Khoa Học Tự Nhiên cấp.

Chỉ có thể ghi danh vào khóa học này qua thư mời.