Prévisualiser dans un nouvel onglet
Regrouper plusieurs documents en un seul fichier propre est un besoin quotidien. Que vous soyez étudiant, professionnel ou en télétravail, la gestion des PDF est cruciale. Aujourd’hui, je vous présente la solution en utilisant votre Chromebook dans l’automatisation « intelligente » via Python. Cette recherche d’un moyen rapide pour fusionner de deux à plusieurs centaines de fichiers au format Pdf elle part du constat suivant : nativement ChromeOS ne propose pas d’application pour fusionner plusieurs fichiers Pdf en un seul. Avec cette solution, nul besoin de passer par une application ou une web apps. Tout se passe par quelques lignes de codes Python.
Je rappelle, que les opérations effectuées avec le code Python, ne s’effectuent pas sur votre ordinateur, mais directement sur les serveurs de Google. Vous pouvez donc employer un Chromebook ou tout autre ordinateur ayant peu de puissance processeur comme de mémoire. Cela n’empêchera pas les opérations de s’effectuer. La seule obligation étant d’avoir un compte Google.
A retenir :
Ce guide vous propose une automatisation cloud via un script Python utilisant la bibliothèque
pikepdf, permettant un tri avancé par métadonnées (/CreationDate) et une gestion optimisée des ressources système pour aboutir à la fusion de fichiers Pdf.
🛠️ Option 1 : Fusionner des Pdf avec Galerie ?
On aurait pu penser que l’application Galerie aurait permis la fusion de plusieurs Pdf. Mais finalement elle est parfaite pour modifier l’intérieur d’un fichier Pdf (nettoyer des pages, signer, annoter), mais elle s’arrête là quand il faut combiner plusieurs fichiers ensemble. Il ne vous reste que l’option 2 et vous allez voir que c’est rapide et facile à mettre en place.
🚀 Option 2 : La méthode « Expert » (Automatisation & intelligence)
Cette méthode utilise la puissance du Cloud de Google pour traiter des dizaines si ce n’est des centaines de fichiers instantanément, avec une gestion fine de l’ordre des pages.
📂 Étape 1 : Préparer votre Google Drive (Local ou partagé)
C’est l’étape la plus importante pour que le script trouve vos fichiers :
- Pour vos fichiers personnels : Créez un dossier nommé
A_Fusionnerà la racine de Google Drive et glissez-y vos PDF. Si vous décidez d’un autre nom de dossier, modifiez le script dans la partie # — 2. CONFIGURATION — Il en est de même pour le nom final qui sera donné au fichier, une fois les Pdf assemblé. - Pour le travail collaboratif : Si les fichiers sont dans un dossier qu’un collègue a partagé avec vous, il n’apparaît pas par défaut dans « Mon Drive ».
- Allez dans l’onglet « Partagés avec moi » de votre Drive.
- Faites un clic droit sur le dossier partagé.
- Choisissez « Ajouter un raccourci dans Drive », puis sélectionnez « Mon Drive ».
- Renommez ce raccourci
A_Fusionner. Le script pourra alors y accéder comme s’il s’agissait de votre propre dossier !
⚙️ Étape 2 : Le tableau de bord : Personnalisez votre fusion
Avant de cliquer sur le bouton Play, vous avez le contrôle total sur deux réglages magiques situés au début du code :
1. Où va votre fichier ? (sauver_dans_dossier_source)
- Si réglé sur
True: Votre PDF final sera déposé directement dans le dossierA_Fusionner. C’est l’option idéale pour le travail collaboratif : vos collègues voient le résultat au même endroit que les fichiers sources. - Si réglé sur
False: Le PDF final sera créé à la racine de votre Google Drive. Pratique pour ne pas mélanger le résultat final avec les nombreux fichiers de travail.
2. Dans quel ordre assembler ? (type_de_tri)
C’est ici que se cache l’intelligence du script. Vous avez trois choix :
"nom": Pour un tri par ordre alphabétique (01, 02, A, B…)."date": Pour un tri basé sur le moment où vous avez déposé les fichiers sur votre Drive."interne": Le mode « Expert ». Le script va lire la date de création originale inscrite à l’intérieur du PDF (la date du scan). C’est le tri le plus fiable si vous avez importé vos documents dans le désordre.
Les lignes de codes sauver_dans_dossier_source et type_de_tri sont a retrouver dans le code dans la partie configuration. Par défaut, le script est configuré ainsi :
# --- 2. CONFIGURATION ---
nom_dossier_source = "A_Fusionner"
nom_fichier_final = "Document_Assemble.pdf"sauver_dans_dossier_source = True
type_de_tri = "interne"
A vous de modifier dans le script porté ci-dessous suivant les options que vous aurez choisi après l’avoir copié dans colab.research.google.com.
💻 Étape 3 : Le script de fusion intelligent
Rendez-vous sur colab.research.google.com et utilisez ce script que vous retrouvez en dessous du script dans un fichier à télécharger :
# --- INSTALLATION DES OUTILS ---
!pip install pikepdf -q
import os
import pikepdf
from google.colab import drive
from datetime import datetime
# --- 1. CONNEXION AU DRIVE ---
if not os.path.exists('/content/drive'):
drive.mount('/content/drive')
# --- 2. CONFIGURATION ---
nom_dossier_source = "A_Fusionner"
nom_fichier_final = "Document_Assemble.pdf"
sauver_dans_dossier_source = True
type_de_tri = "interne"
dossier_source = f"/content/drive/MyDrive/{nom_dossier_source}"
chemin_final = os.path.join(dossier_source, nom_fichier_final) if sauver_dans_dossier_source else f"/content/drive/MyDrive/{nom_fichier_final}"
# --- 3. FONCTION DE LECTURE DES MÉTADONNÉES ---
def obtenir_date_tri(chemin):
try:
with pikepdf.open(chemin) as pdf:
meta = pdf.docinfo
if '/CreationDate' in meta:
return str(meta['/CreationDate'])
except:
pass
return str(os.path.getmtime(chemin))
# --- 4. EXÉCUTION DU TRAITEMENT ---
print(f"🚀 Analyse du dossier '{nom_dossier_source}'...")
if not os.path.exists(dossier_source):
print(f"❌ Erreur : Dossier introuvable.")
else:
# FILTRE : On ignore le fichier final déjà présent pour ne pas fusionner le résultat avec les sources
fichiers = [f for f in os.listdir(dossier_source) if f.lower().endswith('.pdf') and f != nom_fichier_final]
if not fichiers:
print("⚠️ Aucun PDF trouvé dans le dossier.")
else:
try:
if type_de_tri == "interne":
print("🔍 Lecture de la mémoire interne des PDF (Date de création)...")
fichiers.sort(key=lambda x: obtenir_date_tri(os.path.join(dossier_source, x)))
elif type_de_tri == "date":
print("📅 Tri par date de fichier (Google Drive) activé.")
fichiers.sort(key=lambda x: os.path.getmtime(os.path.join(dossier_source, x)))
else:
print("🔤 Tri alphabétique (par nom) activé.")
fichiers.sort()
except Exception as e:
print(f"⚠️ Souci lors du tri ({e}).")
fichiers.sort()
print(f"📄 Fusion de {len(fichiers)} fichiers en cours...")
nouveau_pdf = pikepdf.Pdf.new()
fichiers_ajoutes = 0
for f in fichiers:
chemin_pdf = os.path.join(dossier_source, f)
try:
with pikepdf.open(chemin_pdf) as pdf_a_ajouter:
nouveau_pdf.pages.extend(pdf_a_ajouter.pages)
print(f"✅ Ajouté : {f}")
fichiers_ajoutes += 1
except Exception as e:
print(f"❌ Impossible de lire {f} (Fichier endommagé).")
if fichiers_ajoutes > 0:
nouveau_pdf.save(chemin_final, linearize=True)
print(f"\n✨ OPÉRATION RÉUSSIE !")
print(f"📍 Emplacement : {chemin_final.replace('/content/drive/MyDrive/', 'Mon Drive / ')}")
Script au format Pdf à télécharger
Un contenu de qualité, sans publicité.
Vous aimez notre travail ? Soutenez notre indépendance en devenant membre sur Patreon.
Soutenir MyChromebook.fr🧐 Le saviez-vous ? Le PDF a une mémoire ! Notre script propose une option exclusive : le tri « interne ». Contrairement au tri classique qui regarde quand le fichier a été déposé sur Drive, le mode interne ouvre le document pour lire sa véritable « date de naissance » inscrite par votre scanner ou votre application. C’est la garantie d’un classement chronologique parfait, même si vous avez importé vos fichiers dans le désordre !
⚠️ Que faire en cas de message d’erreur rouge ? Si vous voyez le message « Impossible de lire le fichier… », ne paniquez pas. Notre script est conçu pour être « résilient » : il détecte les fichiers corrompus ou mal formés, les ignore, et continue la fusion avec le reste de vos documents. Votre fichier final sera créé avec tous les PDF valides.
⚠️ Attention à l’écrasement ! Chaque fois que vous lancez le script, il crée un nouveau fichier Document_Assemble.pdf ou le nom que vous avez défini. Si vous voulez conserver une fusion précédente, pensez à renommer le fichier final (par exemple : Rapport_Final_V1.pdf) ou à le déplacer hors du dossier A_Fusionner avant de relancer une nouvelle fusion.
💾 Étape 4 : Archiver sur disque dur ou clé USB
Pour mettre le résultat sur votre matériel physique (Disque Dur externe ou clé USB) :
- Branchez votre support USB au Chromebook.
- Dans l’application Fichiers, trouvez votre PDF fusionné sur le Drive.
- Faites un clic droit et cochez « Disponible hors connexion ». ChromeOS télécharge alors le fichier sur la mémoire interne.
- Une fois synchronisé (petite coche bleue), glissez-le vers votre Disque Externe.
📊 Fiche technique : Fusionneur Cloud
| Caractéristique | Spécification technique | Avantage utilisateur |
| Modes de Tri | Nom, Date Drive, Date interne | S’adapte à votre organisation (ou désorganisation !) |
| Moteur PDF | Pikepdf (Standard Industriel) | Fusion sans perte de qualité et fichiers légers |
| Intelligence | Analyse /CreationDate | Respecte l’ordre réel des scans, même après import |
| Collaboration | Support des raccourcis partagés | Fusionnez les fichiers d’une équipe en un clic |
| Sauvegarde | Pont « Hors-ligne » vers USB | Archivage physique sécurisé pour libérer de l’espace |
J’ai choisi la bibliothèque Pikepdf car elle repose sur le moteur industriel QPDF. Contrairement aux outils en ligne gratuits qui compressent souvent trop vos fichiers, cette méthode garantit que vos images et vos textes restent nets, tout en rendant le fichier final plus rapide à charger dans un navigateur.
Dans l’univers Python, il existe principalement trois bibliothèques pour manipuler les PDF. Voici pourquoi j’ai choisi la meilleure :
1. Pikepdf (Celle que nous utilisons)
C’est actuellement la Rolls-Royce pour la fusion.
- Pourquoi ? Elle est basée sur un moteur en C++ ultra-puissant appelé QPDF.
- Le point fort : Elle ne se contente pas de copier les pages, elle nettoie et optimise la structure du fichier. C’est elle qui nous permet de faire la linéarisation (le « Fast Web View ») pour que le PDF s’affiche instantanément sur le web.
- Gestion des erreurs : Elle est capable de récupérer des fichiers légèrement endommagés là où les autres s’arrêtent.
2. PyPDF2 (L’ancienne référence)
C’est la plus connue historiquement, mais elle commence à dater.
- Le problème : Elle a souvent des soucis avec les polices de caractères modernes ou les formulaires interactifs.
- Le verdict : Elle est plus lente et produit parfois des fichiers fusionnés beaucoup plus lourds que les originaux.
3. Borb ou ReportLab
Ces bibliothèques sont fantastiques, mais elles sont faites pour créer des PDF de zéro (générer des factures, des graphiques).
- Le problème : Elles sont très complexes à coder pour une simple fusion de fichiers existants. C’est comme utiliser un avion de chasse pour aller chercher le pain.
📊 Fiche technique
| Bibliothèque | Performance | Fiabilité | Usage Idéal |
| Pikepdf | 🚀 Excellente | ✅ Très haute | Fusion, rotation, optimisation Pro |
| PyPDF2 | 🐢 Moyenne | ⚠️ Aléatoire | Petits scripts basiques |
| ReportLab | ⚙️ Complexe | ✅ Haute | Création de documents de A à Z |
Vous avez apprécier ce script Python permettant de fusionner vos PDF ? Dimanche prochain, nous allons voir comment faire la même chose avec vos Google Docs et Google Sheets pour automatiser vos rapports de fin d’année ! On le voit, la puissance de Python sur Chromebook n’a pas de limite.
Si vous désirez un script en python, pour une opération a effectuer sur vos fichiers, n’hésitez pas à le demander dans les commentaires. Vous pouvez retrouver l’ensemble de nos articles sur l’intégration de script Python en cliquant ici.
FAQ (Foire Aux Questions)
Puis-je fusionner des PDF si mon Chromebook n’est pas puissant ?
Oui. En utilisant la méthode Python via Google Colab, les calculs sont effectués sur les serveurs de Google et non sur votre processeur local.
Qu’est-ce que le tri « interne » proposé par le script ?
Contrairement au tri par nom, le tri interne lit la date de création réelle inscrite dans les métadonnées du document par le scanner ou le logiciel d’origine.
Le script fonctionne-t-il avec des dossiers partagés ?
Absolument. Il suffit de créer un raccourci du dossier partagé dans « Mon Drive » pour que le script puisse y accéder.




