PHP读取Excel必须用PhpSpreadsheet,PHPExcel已停维护;需显式映射表头、清洗空格、校验字段、分批处理大文件,并做好错误记录与事务控制。
PhpSpreadsheet,别碰 PHPExcel
旧版 PHPExcel 已停止维护,composer 安装会失败或报 Class 'PHPExcel_IOFactory' not found。现在唯一靠谱的选择是 PhpSpreadsheet(phpoffice/phpspreadsheet),它兼容 PHP 7.2+,支持 .xlsx、.xls、.csv,且内存占用更可控。
安装命令:
composer require phpoffice/phpspreadsheet
zip extension is not loaded,需在 php.ini 中启用 extension=zip
PhpSpreadsheet 默认不读取单元格样式/公式结果,只读值;如需显示公式计算后的值(比如“=A1+B1”显示为数字),得用 $cell->getCalculatedValue(),但性能会下降班级通信录常见字段如:学号、姓名、性别、手机号、家长电话、家庭住址。Excel 表头可能写成“学生姓名”“联系电话(家长)”甚至中英文混用,直接按列索引($row[0], $row[1])极易错位。
正确做法是先读第一行作为键名,再用 array_combine() 构建关联数组:
$header = $worksheet->rangeToArray('A1:'.$worksheet->>getHighestColumn().'1')[0];
$dataRows = $worksheet->rangeToArray('A2:'.$worksheet->getHighestColumn().$worksheet->getHighestRow());
foreach ($dataRows as $row) {
$record = array_combine($header, $row);
// 后续插入数据库时用 $record['姓名']、$record['手机号'] 等
}
trim() 和 str_replace() 清洗$spreadsheet->getSheetByName('名单') 指定,别默认用第一个null 的数组,插入前要加 array_filter($row, 'strlen') 过滤Excel 导入最常踩的坑不是读取失败,而是把“张三”输成“张 三”、手机号带空格、“男 ”多一个空格、学号填成文本格式导致后续查询失效。
preg_replace('/\D/', '', $phone) 去除非数字字符,再判断长度是否为 11
123456789012 显示为 1.23457E+11),需在读取时强制设为字符串:$cell->getStyle()->getNumberFormat()->setFormatCode(\PhpOffice\PhpSpreadsheet\Style\NumberFormat::FORMAT_TEXT)
INSERT IGNORE INTO 或先 SELECT COUNT(*) WHERE stu_id = ? 防止重复导入同一学生默认 PHP 配置扛不住整表一次性载入,PhpSpreadsheet 加载 1000 行 xlsx 就可能吃掉 128MB 内存。线上环境必须控制节奏。
$worksheet->getRowIterator($startRow, $endRow) 分段读取,比如每 200 行一批gc_collect_cycles() 主动触发垃圾回收set_time_limit(0);Web 模式下改 Nginx fastcgi_read_timeout 和 PHP max_execution_time
PDO 实例,复用连接,用 beginTransaction() + commit() 包裹整批插入真正难的不是读 Excel,是让导入过程可中断、可追溯、可回滚。比如记录已处理行号到临时表,下次断点续传;或者生成导入日志文件供人工核查。这些细节,比选哪个库重要得多。