一般在數(shù)據(jù)庫中,我們保存的都只是 int 、 varchar 類型的數(shù)據(jù),一是因為現(xiàn)代的關系型數(shù)據(jù)庫對于這些內容會有很多的優(yōu)化,二是大部分的索引也無法施加在內容過多的字段上,比如說 text 類型的字段就很不適合創(chuàng)建索引。所以,我們在使用數(shù)據(jù)庫時,很少會向數(shù)據(jù)庫中存儲很大的內容字段。但是,MySQL 其實也為我們準備了這種類型的存儲,只是我們平常用得不多而已。今天我們就來學習了解一下使用 PDO 如何操作 MySQL 中的大數(shù)據(jù)對象。
“大”通常意味著“大約 4kb 或以上”,盡管某些數(shù)據(jù)庫在數(shù)據(jù)達到“大”之前可以輕松地處理多達 32kb 的數(shù)據(jù)。大對象本質上可能是文本或二進制形式的,我們在 PDOStatement::bindParam() 或 PDOStatement::bindColumn() 調用中使用 PDO::PARAM_LOB 類型碼可以讓 PDO 使用大數(shù)據(jù)類型。PDO::PARAM_LOB 告訴 PDO 作為流來映射數(shù)據(jù),以便能使用 PHP Streams API 來操作。
對于 MySQL 來說,將字段類型設置為 blob 即是大對象格式的字段。而在 bindParam() 或 bindColumn() 時,指定字段的參數(shù)為 PDO::PARAM_LOB 類型,就可以直接以句柄形式獲得這個對象里面的內容,就像 fopen() 一樣地繼續(xù)對它進行操作。
CREATE TABLE `zy_blob` (
`id` int(11) NOT NULL AUTO_INCREMENT,
`attach` longblob,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8mb4 COLLATE=utf8mb4_bin;
這是我們測試用的一個數(shù)據(jù)表,將 attach 字段設置為了 longblob 類型,也就是比較大的 blob 類型,這樣我們就可以存儲更多地信息。畢竟現(xiàn)在的圖片或文件隨隨便便就是輕松地幾m或幾十m起步的,我們直接使用最大的 blob 類型來進行簡單地測試。tinyblob 的大小為 255 字節(jié),blob 類型的大小為 65k ,mediumblob 為 16M ,longblob 為 4G 。
我們先來簡單地直接操作大數(shù)據(jù)對象,看看是什么樣的結果。
$stmt = $pdo->prepare("insert into zy_blob (attach) values (?)");
$fp = fopen('4960364865db53dcb33bcf.rar', 'rb');
$stmt->execute([$fp]);
$stmt = $pdo->query("select attach from zy_blob where id=1");
$file = $stmt->fetch(PDO::FETCH_ASSOC);
print_r($file);
// Array
// (
// [attach] => Resource id #6
// )
在這段代碼中,我們沒有綁定字段,然后直接將 fopen() 打開的文件存儲到 blob 字段中??梢钥闯?,在數(shù)據(jù)庫中,blob 相關的字段只是存儲了 Resource id #6 這樣的字符串。也就是說,在不做任何處理的情況下,$fp 句柄被強制轉換成了字符串類型,而句柄類型被強轉的結果就是只會輸出一個資源ID,而 blob 也只是和字符類型的字段一樣記錄了這個字符串而已。
接下來我們來看看正確的姿勢,也就是通過 bindParam() 來插入數(shù)據(jù),通過 bindColumn() 來讀取數(shù)據(jù)。
$stmt = $pdo->prepare("insert into zy_blob (attach) values (?)");
$fp = fopen('4960364865db53dcb33bcf.rar', 'rb');
$stmt->bindParam(1, $fp, PDO::PARAM_LOB); // 綁定參數(shù)類型為 PDO::PARAM_LOB
$stmt->execute();
$stmt = $pdo->prepare("select attach from zy_blob where id=2");
// // $file = $stmt->fetch(PDO::FETCH_ASSOC);
// // print_r($file); // 空的
$stmt->execute();
$stmt->bindColumn(1, $file, PDO::PARAM_LOB); // 綁定一列到一個 PHP 變量
$stmt->fetch(PDO::FETCH_BOUND); // 指定獲取方式,返回 TRUE 且將結果集中的列值分配給通過 PDOStatement::bindParam() 或 PDOStatement::bindColumn() 方法綁定的 PHP 變量
print_r($file); // 二進制亂碼內容
$fp = fopen('a.rar', 'wb');
fwrite($fp, $file);
首先,我們通過 bindParam() 綁定數(shù)據(jù),并指定 PDO::PARAM_LOB 類型之后,就正常地向數(shù)據(jù)庫里插入了文件的句柄二進制內容。接著,我們使用 bindColumn() 并且也指定 PDO::PARAM_LOB 類型來獲得查詢出來的數(shù)據(jù)。直接打印查詢出來的字段信息,就可以看到它是二進制的類型內容。最后,我們將這個二進制內容保存成另一個名稱的文件。
大家可以替換上面的文件內容,然后執(zhí)行代碼來看看最后生成的文件是不是和原來的文件一樣的。我這里使用的是一個壓縮包文件,最后生成的 a.rar 文件和原始文件大小以及解壓后的內容都是完全一致的。
大數(shù)據(jù)對象操作的究竟是什么呢?其實就是我們平常要保存的大文件。我們將這些文件以二進制流的方式讀取到程序后,再將它們保存在數(shù)據(jù)庫的字段中。想想我們平常開發(fā)用到的最多的圖片保存就可以用這個來做。但是,此處可以劃重點了,我們更加推薦的還是將文件直接保存在文件目錄中,而數(shù)據(jù)庫中只保存它們的路徑就可以了。數(shù)據(jù)庫資源是寶貴的,表越大越不利于優(yōu)化,而且數(shù)據(jù)庫本身還有緩存機制,浪費它的資源來保存這種大型的文件其實是得不償失的。當然,如果有某些特殊的需要,比如一些私密文件不想直接在硬盤文件目錄中保存,或者做為臨時的跨服務器存儲方案都是可以的。
在現(xiàn)代開發(fā)中,相信你的公司也不會吝嗇到不去買一個云存儲(七牛、upyun、阿里云OSS)。它們不僅僅是能夠做為一個存儲器、網(wǎng)盤,而是有更多的功能,比如圖片的裁剪、水印,贈送的 CDN 、帶寬 、 流量之類的,總之,現(xiàn)代的存儲大家還是盡量上云吧,即使是個人開發(fā),也有不少廠商會提供小流量小數(shù)據(jù)量情況下的免費使用,這個都比我們自己來要方便很多。
測試代碼:
https://github.com/zhangyue0503/dev-blog/blob/master/php/202008/source/PDO%E6%93%8D%E4%BD%9C%E5%A4%A7%E6%95%B0%E6%8D%AE%E5%AF%B9%E8%B1%A1.php
參考文檔:
https://www.php.net/manual/zh/pdo.lobs.php