move TIME_ZONE set by env var from local_settings to settings, resolves #462

Merge pull request #450 from InterN0te/main-delete-files-on-disk
Following Delete files on disk #426
2024-02-02 05:51:20 +11:00 · 2024-01-17 22:31:09 +11:00 · 2024-01-17 22:29:59 +11:00 · 2024-01-16 11:57:00 +02:00 · 2024-01-03 16:06:17 +11:00 · 2024-01-01 09:16:04 -08:00
21 changed files with 347 additions and 87 deletions
--- a/.github/workflows/ci.yaml
+++ b/.github/workflows/ci.yaml
@ -4,6 +4,7 @@ env:
  IMAGE_NAME: tubesync

 on:
+  workflow_dispatch:
  push:
    branches:
      - main
--- a/8
+++ b/8
@ -2,8 +2,8 @@ FROM debian:bookworm-slim

 ARG TARGETPLATFORM
 ARG S6_VERSION="3.1.5.0"
-ARG FFMPEG_DATE="autobuild-2023-09-24-14-11"
-ARG FFMPEG_VERSION="112171-g13a3e2a9b4"
+ARG FFMPEG_DATE="autobuild-2023-11-29-14-19"
+ARG FFMPEG_VERSION="112875-g47e214245b"

 ENV DEBIAN_FRONTEND="noninteractive" \
  HOME="/root" \
@ -27,8 +27,8 @@ RUN export ARCH=$(case ${TARGETPLATFORM:-linux/amd64} in \
  "linux/arm64")   echo "https://github.com/just-containers/s6-overlay/releases/download/v${S6_VERSION}/s6-overlay-aarch64.tar.xz" ;; \
  *)               echo ""        ;; esac) && \
  export FFMPEG_EXPECTED_SHA256=$(case ${TARGETPLATFORM:-linux/amd64} in \
-  "linux/amd64")   echo "71cd08ed38c33ff2625dcca68d05efda090bdae455625d3bb1e4be4a53bf7c11" ;; \
-  "linux/arm64")   echo "b6765d97f20cecef0121559ee26a2f0dfbac6aef49c48c71eb703271cb3f527b" ;; \
+  "linux/amd64")   echo "36bac8c527bf390603416f749ab0dd860142b0a66f0865b67366062a9c286c8b" ;; \
+  "linux/arm64")   echo "8f36e45d99d2367a5c0c220ee3164fa48f4f0cec35f78204ccced8dc303bfbdc" ;; \
  *)               echo ""        ;; esac) && \
  export FFMPEG_DOWNLOAD=$(case ${TARGETPLATFORM:-linux/amd64} in \
  "linux/amd64")   echo "https://github.com/yt-dlp/FFmpeg-Builds/releases/download/${FFMPEG_DATE}/ffmpeg-N-${FFMPEG_VERSION}-linux64-gpl.tar.xz"   ;; \
--- a/4
+++ b/4
@ -29,6 +29,10 @@ runcontainer:
 	$(docker) run --rm --name $(name) --env-file dev.env --log-opt max-size=50m -ti -p 4848:4848 $(image)


+stopcontainer:
+	$(docker) stop $(name)
+
+
 test: build
 	cd tubesync && $(python) manage.py test --verbosity=2 && cd ..

--- a/docs/other-database-backends.md
+++ b/docs/other-database-backends.md
@ -24,7 +24,7 @@ $ docker exec -i tubesync python3 /app/manage.py dumpdata > some-file.json
 Then change you database backend over, then use

 ```bash
-$ cat some-file.json | docker exec -i tubesync python3 /app/manage.py loaddata --format=json -
+$ cat some-file.json | docker exec -i tubesync python3 /app/manage.py loaddata - --format=json
 ```

 As detailed in the Django documentation:
@ -78,3 +78,55 @@ entry in the container or stdout logs:

 If you see a line similar to the above and the web interface loads, congratulations,
 you are now using an external database server for your TubeSync data!
+
+## Database Compression (For MariaDB)
+With a lot of media files the `sync_media` table grows in size quickly.
+You can save space using column compression using the following steps while using MariaDB:
+
+ 1. Stop tubesync 
+ 2. Execute `ALTER TABLE sync_media MODIFY metadata LONGTEXT COMPRESSED;` on database tubesync
+ 3. Start tunesync and confirm the connection still works.
+
+## Docker Compose
+
+If you're using Docker Compose and simply want to connect to another container with
+the DB for the performance benefits, a configuration like this would be enough:
+
+```
+ tubesync-db:
+  image: postgres:15.2
+  container_name: tubesync-db
+  restart: unless-stopped
+  volumes:
+   - /<path/to>/init.sql:/docker-entrypoint-initdb.d/init.sql
+   - /<path/to>/tubesync-db:/var/lib/postgresql/data
+  environment:
+   - POSTGRES_USER=postgres
+   - POSTGRES_PASSWORD=testpassword
+
+ tubesync:
+  image: ghcr.io/meeb/tubesync:latest
+  container_name: tubesync
+  restart: unless-stopped
+  ports:
+   - 4848:4848
+  volumes:
+   - /<path/to>/tubesync/config:/config
+   - /<path/to>/YouTube:/downloads
+  environment:
+   - DATABASE_CONNECTION=postgresql://postgres:testpassword@tubesync-db:5432/tubesync
+  depends_on:
+   - tubesync-db
+```
+
+Note that an `init.sql` file is needed to initialize the `tubesync`
+database before it can be written to. This file should contain:
+
+```
+CREATE DATABASE tubesync;
+```
+
+
+Then it must be mapped to `/docker-entrypoint-initdb.d/init.sql` for it
+to be executed on first startup of the container. See the `tubesync-db`
+volume mapping above for how to do this.
--- a/tubesync/common/logger.py
+++ b/tubesync/common/logger.py
@ -1,10 +1,14 @@
 import logging
+from django.conf import settings
+
+
+logging_level = logging.DEBUG if settings.DEBUG else logging.INFO


 log = logging.getLogger('tubesync')
-log.setLevel(logging.DEBUG)
+log.setLevel(logging_level)
 ch = logging.StreamHandler()
-ch.setLevel(logging.DEBUG)
+ch.setLevel(logging_level)
 formatter = logging.Formatter('%(asctime)s [%(name)s/%(levelname)s] %(message)s')
 ch.setFormatter(formatter)
 log.addHandler(ch)
--- a/tubesync/common/templates/pagination.html
+++ b/tubesync/common/templates/pagination.html
@ -3,7 +3,7 @@
  <div class="col s12">
    <div class="pagination">
      {% for i in paginator.page_range %}
-        <a class="pagenum{% if i == page_obj.number %} currentpage{% endif %}" href="?{% if filter %}filter={{ filter }}&{% endif %}page={{ i }}{% if show_skipped %}&show_skipped=yes{% endif %}">{{ i }}</a>
+        <a class="pagenum{% if i == page_obj.number %} currentpage{% endif %}" href="?{% if filter %}filter={{ filter }}&{% endif %}page={{ i }}{% if show_skipped %}&show_skipped=yes{% endif %}{% if only_skipped %}&only_skipped=yes{% endif %}">{{ i }}</a>
      {% endfor %}
    </div>
  </div>
--- a/tubesync/sync/migrations/0019_add_delete_removed_media.py
+++ b/tubesync/sync/migrations/0019_add_delete_removed_media.py
@ -0,0 +1,17 @@
+# Generated by pac
+
+from django.db import migrations, models
+
+class Migration(migrations.Migration):
+
+    dependencies = [
+        ('sync', '0018_source_subtitles'),
+    ]
+
+    operations = [
+        migrations.AddField(
+            model_name='source',
+            name='delete_removed_media',
+            field=models.BooleanField(default=False, help_text='Delete media that is no longer on this playlist', verbose_name='delete removed media'),
+        ),
+    ]
--- a/tubesync/sync/migrations/0020_auto_20231024_1825.py
+++ b/tubesync/sync/migrations/0020_auto_20231024_1825.py
@ -0,0 +1,29 @@
+# Generated by Django 3.2.22 on 2023-10-24 17:25
+
+import django.core.validators
+from django.db import migrations, models
+
+
+class Migration(migrations.Migration):
+
+    dependencies = [
+        ('sync', '0019_add_delete_removed_media'),
+    ]
+
+    operations = [
+        migrations.AddField(
+            model_name='source',
+            name='filter_text',
+            field=models.CharField(blank=True, default='', help_text='Regex compatible filter string for video titles', max_length=100, verbose_name='filter string'),
+        ),
+        migrations.AlterField(
+            model_name='source',
+            name='auto_subtitles',
+            field=models.BooleanField(default=False, help_text='Accept auto-generated subtitles', verbose_name='accept auto-generated subs'),
+        ),
+        migrations.AlterField(
+            model_name='source',
+            name='sub_langs',
+            field=models.CharField(default='en', help_text='List of subtitles langs to download, comma-separated. Example: en,fr or all,-fr,-live_chat', max_length=30, validators=[django.core.validators.RegexValidator(message='Subtitle langs must be a comma-separated list of langs. example: en,fr or all,-fr,-live_chat', regex='^(\\-?[\\_\\.a-zA-Z]+,)*(\\-?[\\_\\.a-zA-Z]+){1}$')], verbose_name='subs langs'),
+        ),
+    ]
--- a/tubesync/sync/migrations/0021_add_delete_files_on_disk.py
+++ b/tubesync/sync/migrations/0021_add_delete_files_on_disk.py
@ -0,0 +1,17 @@
+# Generated by pac
+
+from django.db import migrations, models
+
+class Migration(migrations.Migration):
+
+    dependencies = [
+        ('sync', '0020_auto_20231024_1825'),
+    ]
+
+    operations = [
+        migrations.AddField(
+            model_name='source',
+            name='delete_files_on_disk',
+            field=models.BooleanField(default=False, help_text='Delete files on disk when they are removed from TubeSync', verbose_name='delete files on disk'),
+        ),
+    ]
--- a/tubesync/sync/models.py
+++ b/tubesync/sync/models.py
@ -1,6 +1,7 @@
 import os
 import uuid
 import json
+import re
 from xml.etree import ElementTree
 from collections import OrderedDict
 from datetime import datetime, timedelta
@ -17,7 +18,7 @@ from common.utils import clean_filename
 from .youtube import (get_media_info as get_youtube_media_info,
                      download_media as download_youtube_media)
 from .utils import seconds_to_timestr, parse_media_format
-from .matching import (get_best_combined_format, get_best_audio_format, 
+from .matching import (get_best_combined_format, get_best_audio_format,
                       get_best_video_format)
 from .mediaservers import PlexMediaServer
 from .fields import CommaSepChoiceField
@ -106,7 +107,6 @@ class Source(models.Model):
    EXTENSION_MKV = 'mkv'
    EXTENSIONS = (EXTENSION_M4A, EXTENSION_OGG, EXTENSION_MKV)

-
    # as stolen from: https://wiki.sponsor.ajay.app/w/Types / https://github.com/yt-dlp/yt-dlp/blob/master/yt_dlp/postprocessor/sponsorblock.py
    SPONSORBLOCK_CATEGORIES_CHOICES = (
        ('sponsor', 'Sponsor'),
@ -118,17 +118,16 @@ class Source(models.Model):
        ('interaction', 'Interaction Reminder'),
        ('music_offtopic', 'Non-Music Section'),
    )
-    
-    sponsorblock_categories = CommaSepChoiceField(
-            _(''),
-            possible_choices=SPONSORBLOCK_CATEGORIES_CHOICES,
-            all_choice="all",
-            allow_all=True,
-            all_label="(all options)",
-            default="all",
-            help_text=_("Select the sponsorblocks you want to enforce")
-        )

+    sponsorblock_categories = CommaSepChoiceField(
+        _(''),
+        possible_choices=SPONSORBLOCK_CATEGORIES_CHOICES,
+        all_choice='all',
+        allow_all=True,
+        all_label='(all options)',
+        default='all',
+        help_text=_('Select the sponsorblocks you want to enforce')
+    )
    embed_metadata = models.BooleanField(
        _('embed metadata'),
        default=False,
@ -139,14 +138,12 @@ class Source(models.Model):
        default=False,
        help_text=_('Embed thumbnail into the file')
    )
-
    enable_sponsorblock = models.BooleanField(
        _('enable sponsorblock'),
        default=True,
        help_text=_('Use SponsorBlock?')
    )

-
    # Fontawesome icons used for the source on the front end
    ICONS = {
        SOURCE_TYPE_YOUTUBE_CHANNEL: '<i class="fab fa-youtube"></i>',
@ -287,6 +284,23 @@ class Source(models.Model):
        help_text=_('If "delete old media" is ticked, the number of days after which '
                    'to automatically delete media')
    )
+    filter_text = models.CharField(
+        _('filter string'),
+        max_length=100,
+        default='',
+        blank=True,
+        help_text=_('Regex compatible filter string for video titles')
+    )
+    delete_removed_media = models.BooleanField(
+        _('delete removed media'),
+        default=False,
+        help_text=_('Delete media that is no longer on this playlist')
+    )
+    delete_files_on_disk = models.BooleanField(
+        _('delete files on disk'),
+        default=False,
+        help_text=_('Delete files on disk when they are removed from TubeSync')
+    )
    source_resolution = models.CharField(
        _('source resolution'),
        max_length=8,
@ -511,6 +525,7 @@ class Source(models.Model):
            'dd': now.strftime('%d'),
            'source': self.slugname,
            'source_full': self.name,
+            'uploader': 'Some Channel Name',
            'title': 'some-media-title-name',
            'title_full': 'Some Media Title Name',
            'key': 'SoMeUnIqUiD',
@ -532,6 +547,11 @@ class Source(models.Model):
        except Exception as e:
            return ''

+    def is_regex_match(self, media_item_title):
+        if not self.filter_text:
+            return True
+        return bool(re.search(self.filter_text, media_item_title))
+    
    def index_media(self):
        '''
            Index the media source returning a list of media metadata as dicts.
@ -1020,6 +1040,7 @@ class Media(models.Model):
            'acodec': display_format['acodec'],
            'fps': display_format['fps'],
            'hdr': display_format['hdr'],
+            'uploader': self.uploader,
        }

    @property
@ -1216,7 +1237,6 @@ class Media(models.Model):
            acodec = self.downloaded_audio_codec
            if acodec is None:
                raise TypeError() # nothing here.
-            
            acodec = acodec.lower()
            if acodec == "mp4a":
                return "audio/mp4"
@ -1225,7 +1245,6 @@ class Media(models.Model):
            else:
                # fall-fall-back.
                return 'audio/ogg'
-
        vcodec = vcodec.lower()
        if vcodec == 'vp9':
            return 'video/webm'
@ -1249,6 +1268,22 @@ class Media(models.Model):
        showtitle.text = str(self.source.name).strip()
        showtitle.tail = '\n  '
        nfo.append(showtitle)
+        # season = upload date year
+        season = nfo.makeelement('season', {})
+        if self.source.source_type == Source.SOURCE_TYPE_YOUTUBE_PLAYLIST:
+            # If it's a playlist, set season to 1
+            season.text = '1'
+        else:
+            # If it's not a playlist, set season to upload date year
+            season.text = str(self.upload_date.year) if self.upload_date else ''
+        season.tail = '\n  '
+        nfo.append(season)
+        # episode = number of video in the year
+        episode = nfo.makeelement('episode', {})
+        episode_number = self.calculate_episode_number()
+        episode.text = str(episode_number) if episode_number else ''
+        episode.tail = '\n  '
+        nfo.append(episode)
        # ratings = media metadata youtube rating
        value = nfo.makeelement('value', {})
        value.text = str(self.rating)
@ -1356,8 +1391,8 @@ class Media(models.Model):
                                    f'no valid format available')
        # Download the media with youtube-dl
        download_youtube_media(self.url, format_str, self.source.extension,
-                               str(self.filepath), self.source.write_json, 
-                               self.source.sponsorblock_categories, self.source.embed_thumbnail,
+                               str(self.filepath), self.source.write_json,
+                               self.source.sponsorblock_categories.selected_choices, self.source.embed_thumbnail,
                               self.source.embed_metadata, self.source.enable_sponsorblock,
                              self.source.write_subtitles, self.source.auto_subtitles,self.source.sub_langs )
        # Return the download paramaters
@ -1373,6 +1408,19 @@ class Media(models.Model):
                            f'has no indexer')
        return indexer(self.url)

+    def calculate_episode_number(self):
+        if self.source.source_type == Source.SOURCE_TYPE_YOUTUBE_PLAYLIST:
+            sorted_media = Media.objects.filter(source=self.source)
+        else:
+            self_year = self.upload_date.year if self.upload_date else self.created.year
+            filtered_media = Media.objects.filter(source=self.source, published__year=self_year)
+            sorted_media = sorted(filtered_media, key=lambda x: (x.upload_date, x.key))
+        position_counter = 1
+        for media in sorted_media:
+            if media == self:
+                return position_counter
+            position_counter += 1
+

 class MediaServer(models.Model):
    '''
--- a/tubesync/sync/signals.py
+++ b/tubesync/sync/signals.py
@ -1,4 +1,5 @@
 import os
+import glob
 from django.conf import settings
 from django.db.models.signals import pre_save, post_save, pre_delete, post_delete
 from django.dispatch import receiver
@ -74,6 +75,7 @@ def source_pre_delete(sender, instance, **kwargs):
        media.delete()


+
@receiver(post_delete, sender=Source)
 def source_post_delete(sender, instance, **kwargs):
    # Triggered after a source is deleted
@ -96,14 +98,14 @@ def media_post_save(sender, instance, created, **kwargs):
    # If the media is skipped manually, bail.
    if instance.manual_skip:
        return
-
    # Triggered after media is saved
    cap_changed = False
    can_download_changed = False
    # Reset the skip flag if the download cap has changed if the media has not
    # already been downloaded
-    if not instance.downloaded:
+    if not instance.downloaded and instance.metadata:
        max_cap_age = instance.source.download_cap_date
+        filter_text = instance.source.filter_text.strip()
        published = instance.published
        if not published:
            if not instance.skip:
@ -117,11 +119,20 @@ def media_post_save(sender, instance, created, **kwargs):
        else:
            if max_cap_age:
                if published > max_cap_age and instance.skip:
-                    # Media was published after the cap date but is set to be skipped
-                    log.info(f'Media: {instance.source} / {instance} has a valid '
-                            f'publishing date, marking to be unskipped')
-                    instance.skip = False
-                    cap_changed = True
+                    if filter_text:
+                        if instance.source.is_regex_match(instance.title):
+                            log.info(f'Media: {instance.source} / {instance} has a valid '
+                                    f'publishing date and title filter, marking to be unskipped')
+                            instance.skip = False
+                            cap_changed = True
+                        else:
+                            log.debug(f'Media: {instance.source} / {instance} has a valid publishing date '
+                                      f'but failed the title filter match, already marked skipped')
+                    else:
+                        log.info(f'Media: {instance.source} / {instance} has a valid '
+                                 f'publishing date, marking to be unskipped')
+                        instance.skip = False
+                        cap_changed = True
                elif published <= max_cap_age and not instance.skip:
                    log.info(f'Media: {instance.source} / {instance} is too old for '
                            f'the download cap date, marking to be skipped')
@ -130,10 +141,20 @@ def media_post_save(sender, instance, created, **kwargs):
            else:
                if instance.skip:
                    # Media marked to be skipped but source download cap removed
-                    log.info(f'Media: {instance.source} / {instance} has a valid '
-                            f'publishing date, marking to be unskipped')
-                    instance.skip = False
-                    cap_changed = True
+                    if filter_text:
+                        if instance.source.is_regex_match(instance.title):
+                            log.info(f'Media: {instance.source} / {instance} has a valid '
+                                     f'publishing date and title filter, marking to be unskipped')
+                            instance.skip = False
+                            cap_changed = True
+                        else:
+                            log.info(f'Media: {instance.source} / {instance} has a valid publishing date '
+                                     f'but failed the title filter match, already marked skipped')
+                else:
+                    log.debug(f'Media: {instance.source} / {instance} has a valid publishing date and '
+                              f'is already marked as not to be skipped')
+
+                    cap_changed = False
    # Recalculate the "can_download" flag, this may
    # need to change if the source specifications have been changed
    if instance.metadata:
@ -156,7 +177,7 @@ def media_post_save(sender, instance, created, **kwargs):
        verbose_name = _('Downloading metadata for "{}"')
        download_media_metadata(
            str(instance.pk),
-            priority=10,
+            priority=5,
            verbose_name=verbose_name.format(instance.pk),
            remove_existing_tasks=True
        )
@ -203,6 +224,16 @@ def media_pre_delete(sender, instance, **kwargs):
    if thumbnail_url:
        delete_task_by_media('sync.tasks.download_media_thumbnail',
                             (str(instance.pk), thumbnail_url))
+    if instance.source.delete_files_on_disk and (instance.media_file or instance.thumb):
+        # Delete all media files if it contains filename
+        filepath = instance.media_file.path if instance.media_file else instance.thumb.path
+        barefilepath, fileext = os.path.splitext(filepath)
+        # Get all files that start with the bare file path
+        all_related_files = glob.glob(f'{barefilepath}.*')
+        for file in all_related_files:
+            log.info(f'Deleting file for: {instance} path: {file}')
+            delete_file(file)
+


@receiver(post_delete, sender=Media)
--- a/tubesync/sync/tasks.py
+++ b/tubesync/sync/tasks.py
@ -142,6 +142,15 @@ def cleanup_old_media():
            media.delete()


+def cleanup_removed_media(source, videos):
+    media_objects = Media.objects.filter(source=source, downloaded=True)
+    for item in media_objects:
+        matching_source_item = [video['id'] for video in videos if video['id'] == item.key]
+        if not matching_source_item:
+            log.info(f'{item.title} is no longer in source, removing')
+            item.delete()
+
+
@background(schedule=0)
 def index_source_task(source_id):
    '''
@ -186,6 +195,9 @@ def index_source_task(source_id):
    cleanup_completed_tasks()
    # Tack on a cleanup of old media
    cleanup_old_media()
+    if source.delete_removed_media:
+        log.info(f'Cleaning up media no longer in source {source}')
+        cleanup_removed_media(source, videos)


@background(schedule=0)
@ -219,11 +231,9 @@ def download_media_metadata(media_id):
        log.error(f'Task download_media_metadata(pk={media_id}) called but no '
                  f'media exists with ID: {media_id}')
        return
-    
    if media.manual_skip:
        log.info(f'Task for ID: {media_id} skipped, due to task being manually skipped.')
        return
-
    source = media.source
    metadata = media.index_metadata()
    media.metadata = json.dumps(metadata, default=json_serial)
@ -242,6 +252,11 @@ def download_media_metadata(media_id):
            log.warn(f'Media: {source} / {media} is older than cap age '
                     f'{max_cap_age}, skipping')
            media.skip = True
+    # If the source has a search filter, check the video title matches the filter
+    if source.filter_text and not source.is_regex_match(media.title):
+        # Filter text not found in the media title. Accepts regex string, blank search filter results in this returning false
+        log.warn(f'Media: {source} / {media} does not match {source.filter_text}, skipping')
+        media.skip = True
    # If the source has a cut-off check the upload date is within the allowed delta
    if source.delete_old_media and source.days_to_keep > 0:
        if not isinstance(media.published, datetime):
--- a/tubesync/sync/templates/sync/_mediaformatvars.html
+++ b/tubesync/sync/templates/sync/_mediaformatvars.html
@ -43,6 +43,11 @@
      <td>Full source name</td>
      <td>My Source</td>
    </tr>
+    <tr>
+      <td>{uploader}</td>
+      <td>Uploader name</td>
+      <td>Some Channel Name</td>
+    </tr>
    <tr>
      <td>{title}</td>
      <td>Lower case media title, max 80 chars</td>
--- a/tubesync/sync/templates/sync/media.html
+++ b/tubesync/sync/templates/sync/media.html
@ -64,5 +64,5 @@
  </div>
  {% endfor %}
 </div>
-{% include 'pagination.html' with pagination=sources.paginator filter=source.pk show_skipped=show_skipped %}
+{% include 'pagination.html' with pagination=sources.paginator filter=source.pk show_skipped=show_skipped only_skipped=only_skipped%}
 {% endblock %}
--- a/tubesync/sync/templates/sync/source-delete.html
+++ b/tubesync/sync/templates/sync/source-delete.html
@ -9,8 +9,8 @@
    <p>
      Are you sure you want to delete this source? Deleting a source is permanent.
      By default, deleting a source does not delete any saved media files. You can
-      tick the &quot;also delete downloaded media&quot; checkbox to also remove save
-      media when you delete the source. Deleting a source cannot be undone.
+      <strong>tick the &quot;also delete downloaded media&quot; checkbox to also remove directory {{ source.directory_path }}
+	  </strong>when you delete the source. Deleting a source cannot be undone.
    </p>
  </div>
 </div>
--- a/tubesync/sync/templates/sync/source.html
+++ b/tubesync/sync/templates/sync/source.html
@ -43,6 +43,10 @@
        <td class="hide-on-small-only">Directory</td>
        <td><span class="hide-on-med-and-up">Directory<br></span><strong>{{ source.directory }}</strong></td>
      </tr>
+      <tr title="Filter text">
+        <td class="hide-on-small-only">Filter text</td>
+        <td><span class="hide-on-med-and-up">Filter text<br></span><strong>{{ source.filter_text }}</strong></td>
+      </tr>
      <tr title="Media file name format to use for saving files">
        <td class="hide-on-small-only">Media format</td>
        <td><span class="hide-on-med-and-up">Media format<br></span><strong>{{ source.media_format }}</strong></td>
@ -115,6 +119,14 @@
        <td class="hide-on-small-only">Write JSON?</td>
        <td><span class="hide-on-med-and-up">Write JSON?<br></span><strong>{% if source.write_json %}<i class="fas fa-check"></i>{% else %}<i class="fas fa-times"></i>{% endif %}</strong></td>
      </tr>
+      <tr title="Delete media that is no longer on this playlist?">
+        <td class="hide-on-small-only">Delete removed media</td>
+        <td><span class="hide-on-med-and-up">Delete removed media<br></span><strong>{% if source.delete_removed_media %}<i class="fas fa-check"></i>{% else %}<i class="fas fa-times"></i>{% endif %}</strong></td>
+      </tr>
+        <tr title="Delete files on disk when they are removed from TubeSync?">
+        <td class="hide-on-small-only">Delete files on disk</td>
+        <td><span class="hide-on-med-and-up">Delete files on disk<br></span><strong>{% if source.delete_files_on_disk %}<i class="fas fa-check"></i>{% else %}<i class="fas fa-times"></i>{% endif %}</strong></td>
+      </tr>
      {% if source.delete_old_media and source.days_to_keep > 0 %}
      <tr title="Days after which your media from this source will be locally deleted">
        <td class="hide-on-small-only">Delete old media</td>
--- a/tubesync/sync/tests.py
+++ b/tubesync/sync/tests.py
@ -175,6 +175,7 @@ class FrontEndTestCase(TestCase):
            'directory': 'testdirectory',
            'media_format': settings.MEDIA_FORMATSTR_DEFAULT,
            'download_cap': 0,
+            'filter_text':'.*',
            'index_schedule': 3600,
            'delete_old_media': False,
            'days_to_keep': 14,
@ -217,6 +218,7 @@ class FrontEndTestCase(TestCase):
            'directory': 'testdirectory',
            'media_format': settings.MEDIA_FORMATSTR_DEFAULT,
            'download_cap': 0,
+            'filter_text':'.*',
            'index_schedule': Source.IndexSchedule.EVERY_HOUR,
            'delete_old_media': False,
            'days_to_keep': 14,
@ -247,6 +249,7 @@ class FrontEndTestCase(TestCase):
            'directory': 'testdirectory',
            'media_format': settings.MEDIA_FORMATSTR_DEFAULT,
            'download_cap': 0,
+            'filter_text':'.*',
            'index_schedule': Source.IndexSchedule.EVERY_2_HOURS,  # changed
            'delete_old_media': False,
            'days_to_keep': 14,
@ -658,6 +661,8 @@ class MediaTestCase(TestCase):
            '<episodedetails>',
            '  <title>no fancy stuff title</title>',
            '  <showtitle>testname</showtitle>',
+            '  <season>2017</season>',
+            '  <episode></episode>',
            '  <ratings>',
            '    <rating default="True" max="5" name="youtube">',
            '      <value>1.2345</value>',
@ -1468,6 +1473,29 @@ class FormatMatchingTestCase(TestCase):
            self.media.get_best_video_format()
            self.media.get_best_audio_format()

+    def test_is_regex_match(self):
+        
+        self.media.metadata = all_test_metadata['boring']
+        expected_matches = {
+            ('.*'): (True),
+            ('no fancy stuff'): (True),
+            ('No fancy stuff'): (False),
+            ('(?i)No fancy stuff'): (True), #set case insensitive flag
+            ('no'): (True),
+            ('Foo'): (False),
+            ('^(?!.*fancy).*$'): (False),
+            ('^(?!.*funny).*$'): (True),
+            ('(?=.*f.*)(?=.{0,2}|.{4,})'): (True),
+            ('f{4,}'): (False),
+            ('^[^A-Z]*$'): (True),
+            ('^[^a-z]*$'): (False),
+            ('^[^\\s]*$'): (False)
+        }
+
+        for params, expected in expected_matches.items():
+            self.source.filter_text = params
+            expected_match_result = expected
+            self.assertEqual(self.source.is_regex_match(self.media.title), expected_match_result)

 class TasksTestCase(TestCase):
    def setUp(self):
--- a/tubesync/sync/views.py
+++ b/tubesync/sync/views.py
@ -1,7 +1,9 @@
+import glob
 import os
 import json
 from base64 import b64decode
 import pathlib
+import shutil
 import sys
 from django.conf import settings
 from django.http import FileResponse, Http404, HttpResponseNotFound, HttpResponseRedirect
@ -59,7 +61,7 @@ class DashboardView(TemplateView):
        # Disk usage
        disk_usage = Media.objects.filter(
            downloaded=True, downloaded_filesize__isnull=False
-        ).aggregate(Sum('downloaded_filesize'))
+        ).defer('metadata').aggregate(Sum('downloaded_filesize'))
        data['disk_usage_bytes'] = disk_usage['downloaded_filesize__sum']
        if not data['disk_usage_bytes']:
            data['disk_usage_bytes'] = 0
@ -71,11 +73,11 @@ class DashboardView(TemplateView):
        # Latest downloads
        data['latest_downloads'] = Media.objects.filter(
            downloaded=True, downloaded_filesize__isnull=False
-        ).order_by('-download_date')[:10]
+        ).defer('metadata').order_by('-download_date')[:10]
        # Largest downloads
        data['largest_downloads'] = Media.objects.filter(
            downloaded=True, downloaded_filesize__isnull=False
-        ).order_by('-downloaded_filesize')[:10]
+        ).defer('metadata').order_by('-downloaded_filesize')[:10]
        # UID and GID
        data['uid'] = os.getuid()
        data['gid'] = os.getgid()
@ -294,12 +296,13 @@ class ValidateSourceView(FormView):

 class EditSourceMixin:
    model = Source
-    fields = ('source_type', 'key', 'name', 'directory', 'media_format',
+    fields = ('source_type', 'key', 'name', 'directory', 'filter_text', 'media_format',
              'index_schedule', 'download_media', 'download_cap', 'delete_old_media',
-              'days_to_keep', 'source_resolution', 'source_vcodec', 'source_acodec',
-              'prefer_60fps', 'prefer_hdr', 'fallback', 'copy_thumbnails', 'write_nfo', 
-              'write_json', 'embed_metadata', 'embed_thumbnail', 'enable_sponsorblock',
-              'sponsorblock_categories', 'write_subtitles', 'auto_subtitles', 'sub_langs')
+              'delete_removed_media', 'delete_files_on_disk', 'days_to_keep', 'source_resolution',
+              'source_vcodec', 'source_acodec', 'prefer_60fps', 'prefer_hdr', 'fallback',
+              'copy_thumbnails', 'write_nfo', 'write_json', 'embed_metadata', 'embed_thumbnail',
+              'enable_sponsorblock', 'sponsorblock_categories', 'write_subtitles',
+              'auto_subtitles', 'sub_langs')
    errors = {
        'invalid_media_format': _('Invalid media format, the media format contains '
                                  'errors or is empty. Check the table at the end of '
@ -403,7 +406,7 @@ class SourceView(DetailView):
            error_message = get_error_message(error)
            setattr(error, 'error_message', error_message)
            data['errors'].append(error)
-        data['media'] = Media.objects.filter(source=self.object).order_by('-published')
+        data['media'] = Media.objects.filter(source=self.object).order_by('-published').defer('metadata')
        return data


@ -434,14 +437,13 @@ class DeleteSourceView(DeleteView, FormMixin):
            source = self.get_object()
            for media in Media.objects.filter(source=source):
                if media.media_file:
-                    # Delete the media file
-                    delete_file(media.media_file.path)
-                    # Delete thumbnail copy if it exists
-                    delete_file(media.thumbpath)
-                    # Delete NFO file if it exists
-                    delete_file(media.nfopath)
-                    # Delete JSON file if it exists
-                    delete_file(media.jsonpath)
+                    file_path = media.media_file.path
+                    matching_files = glob.glob(os.path.splitext(file_path)[0] + '.*')
+                    for file in matching_files:
+                        delete_file(file)
+            directory_path = source.directory_path
+            if os.path.exists(directory_path):
+                shutil.rmtree(directory_path, True)
        return super().post(request, *args, **kwargs)

    def get_success_url(self):
@ -652,12 +654,13 @@ class MediaSkipView(FormView, SingleObjectMixin):
        delete_task_by_media('sync.tasks.download_media', (str(self.object.pk),))
        # If the media file exists on disk, delete it
        if self.object.media_file_exists:
-            delete_file(self.object.media_file.path)
-            self.object.media_file = None
-            # If the media has an associated thumbnail copied, also delete it
-            delete_file(self.object.thumbpath)
-            # If the media has an associated NFO file with it, also delete it
-            delete_file(self.object.nfopath)
+            # Delete all files which contains filename
+            filepath = self.object.media_file.path
+            barefilepath, fileext = os.path.splitext(filepath)
+            # Get all files that start with the bare file path
+            all_related_files = glob.glob(f'{barefilepath}.*')
+            for file in all_related_files:
+                delete_file(file)
        # Reset all download data
        self.object.metadata = None
        self.object.downloaded = False
--- a/tubesync/sync/youtube.py
+++ b/tubesync/sync/youtube.py
@ -1,5 +1,5 @@
 '''
-    Wrapper for the youtube-dl library. Used so if there are any library interface
+    Wrapper for the yt-dlp library. Used so if there are any library interface
    updates we only need to udpate them in one place.
 '''

@ -64,9 +64,9 @@ def get_media_info(url):
    return response


-def download_media(url, media_format, extension, output_file, info_json, 
-                   sponsor_categories="all", 
-                   embed_thumbnail=False, embed_metadata=False, skip_sponsors=True, 
+def download_media(url, media_format, extension, output_file, info_json,
+                   sponsor_categories=None,
+                   embed_thumbnail=False, embed_metadata=False, skip_sponsors=True,
                   write_subtitles=False, auto_subtitles=False, sub_langs='en'):
    '''
        Downloads a YouTube URL to a file on disk.
@ -74,7 +74,7 @@ def download_media(url, media_format, extension, output_file, info_json,

    def hook(event):
        filename = os.path.basename(event['filename'])
-    
+
        if event.get('downloaded_bytes') is None or event.get('total_bytes') is None:
            return None

@ -106,8 +106,8 @@ def download_media(url, media_format, extension, output_file, info_json,
                     f'{total_size_str} in {elapsed_str}')
        else:
            log.warn(f'[youtube-dl] unknown event: {str(event)}')
-    hook.download_progress = 0

+    hook.download_progress = 0
    ytopts = {
        'format': media_format,
        'merge_output_format': extension,
@ -120,29 +120,25 @@ def download_media(url, media_format, extension, output_file, info_json,
        'writeautomaticsub': auto_subtitles,
        'subtitleslangs': sub_langs.split(','),
    }
-    
+    if not sponsor_categories:
+        sponsor_categories = []
    sbopt = {
        'key': 'SponsorBlock',
-        'categories': [sponsor_categories]
+        'categories': sponsor_categories
    }
    ffmdopt = {
        'key': 'FFmpegMetadata',
-        'add_chapters': True,
-        'add_metadata': True
+        'add_chapters': embed_metadata,
+        'add_metadata': embed_metadata
    }
-
    opts = get_yt_opts()
    if embed_thumbnail:
        ytopts['postprocessors'].append({'key': 'EmbedThumbnail'})
-    if embed_metadata:
-        ffmdopt["add_metadata"] = True
    if skip_sponsors:
        ytopts['postprocessors'].append(sbopt)
-    
    ytopts['postprocessors'].append(ffmdopt)
-        
    opts.update(ytopts)
-        
+
    with yt_dlp.YoutubeDL(opts) as y:
        try:
            return y.download([url])
--- a/tubesync/tubesync/local_settings.py.container
+++ b/tubesync/tubesync/local_settings.py.container
@ -25,9 +25,6 @@ DEBUG = True if os.getenv('TUBESYNC_DEBUG', False) else False
 FORCE_SCRIPT_NAME = os.getenv('DJANGO_FORCE_SCRIPT_NAME', DJANGO_URL_PREFIX)


-TIME_ZONE = os.getenv('TZ', 'UTC')
-
-
 database_dict = {}
 database_connection_env = os.getenv('DATABASE_CONNECTION', '')
 if database_connection_env:
--- a/tubesync/tubesync/settings.py
+++ b/tubesync/tubesync/settings.py
@ -1,3 +1,4 @@
+import os
 from pathlib import Path


@ -6,7 +7,7 @@ CONFIG_BASE_DIR = BASE_DIR
 DOWNLOADS_BASE_DIR = BASE_DIR


-VERSION = '0.13.0'
+VERSION = '0.13.3'
 SECRET_KEY = ''
 DEBUG = False
 ALLOWED_HOSTS = []
@ -96,7 +97,7 @@ AUTH_PASSWORD_VALIDATORS = [


 LANGUAGE_CODE = 'en-us'
-TIME_ZONE = 'UTC'
+TIME_ZONE = os.getenv('TZ', 'UTC')
 USE_I18N = True
 USE_L10N = True
 USE_TZ = True
Author	SHA1	Message	Date
meeb	c6acd5378c	move TIME_ZONE set by env var from local_settings to settings, resolves #462	2024-02-02 05:51:20 +11:00
meeb	e7788eb8fb	Merge pull request #450 from InterN0te/main-delete-files-on-disk Following Delete files on disk #426	2024-01-17 22:31:09 +11:00
meeb	e4e0b48c0b	Merge pull request #460 from skayred/main Optimized source page and dashboard loading	2024-01-17 22:29:59 +11:00
Dmitrii Savchenko	3573c1187f	Optimized source page and dashboard loading	2024-01-16 11:57:00 +02:00
meeb	b11b667aff	Merge pull request #452 from ShaneBridges1234/patch-1 Update other-database-backends.md	2024-01-03 16:06:17 +11:00
Yottatron	1b581aa4ba	Update other-database-backends.md Correct table new in SQL for MariaDB column compression.	2024-01-01 09:16:04 -08:00
meeb	7384c00713	fix typo in sponsorblock categories, remove dupe metadata flags, related to #362	2023-12-12 16:28:26 +11:00
meeb	4fdd172b05	tidy up and pass a serialised list through to youtube.download_media, may help with #362	2023-12-12 14:40:23 +11:00
Someone	9c18115032	Merge branch 'meeb:main' into main-delete-files-on-disk	2023-12-11 15:41:50 +01:00
meeb	6853c1fa76	fix tests	2023-12-11 13:42:33 +11:00
administrator	ed07073cf4	Revert "Removed non-pertinent source option" This reverts commit `46ba2593a2`. Restore option	2023-12-11 03:38:37 +01:00
administrator	af94b37ee6	Revert "Removed non-pertinent source option" This reverts commit `ad1d49a835`. t cherry-pick `46a43b9` Restore option	2023-12-11 03:38:14 +01:00
administrator	ad1d49a835	Removed non-pertinent source option	2023-12-11 03:25:17 +01:00
administrator	46ba2593a2	Removed non-pertinent source option	2023-12-11 03:19:43 +01:00
administrator	46a43b968a	Rework delete method to delete all files matching filename Remove Source folder if checkbox 'remove media' is checked	2023-12-11 02:29:57 +01:00
administrator	805a0eefbd	Merge branch 'delete-files-on-disk' of https://github.com/sparklesmcfadden/tubesync into main-delete-files-on-disk Merge from sparklesmcfadden:delete-files-on-disk	2023-12-11 00:19:37 +01:00
meeb	3a87b5779e	Merge pull request #448 from InterN0te/main-addNfoInfo Added season and episode tags in NFO to get Jellyfin displaying correctly	2023-12-10 17:58:04 +11:00
Someone	f86e72aa92	Optimization of episode calculation	2023-12-09 23:13:28 +01:00
Someone	f550e32b5e	Fix secondary sorting on video key	2023-12-09 19:33:59 +01:00
Someone	034d877d6a	Add season and episode tags in NFO test	2023-12-09 17:56:32 +01:00
Someone	b9b702ab85	Add season and episode tags in NFO	2023-12-09 17:55:17 +01:00
meeb	c159c24d15	Merge pull request #443 from depuhitv/patch-1 compress sync_media table for mariadb	2023-12-04 18:05:02 +11:00
depuhitv	6c9772d573	fixed grammar	2023-12-04 16:26:46 +11:00
depuhitv	45b8b3f65b	compress sync_media table for mariadb Added steps to compress sync_media table for mariadb. For 1,608 records, I am seeing the size reduced from 642.8 MB to 55.8 MB	2023-12-04 16:18:10 +11:00
meeb	7aa9c0ec8a	bump to 0.13.3	2023-11-30 18:58:29 +11:00
meeb	e54a762a7b	rework skip logic check, prevent race condition between metadata downloading and upload date being checked, resolves #440 , #183 , related to #438	2023-11-30 18:52:32 +11:00
meeb	512b70adad	toggle logging verbosity based on settings.DEBUG	2023-11-30 18:50:22 +11:00
meeb	6c21ff15ab	stopcontainer helper	2023-11-30 18:49:58 +11:00
meeb	adf26cb4e3	bump ffmpeg to autobuild-2023-11-29-14-19	2023-11-30 18:49:50 +11:00
meeb	45c12561ba	Merge pull request #438 from locke4/main Fix signals.py mistake	2023-11-29 04:05:13 +11:00
locke4	2d6f485a5d	Update signals.py	2023-11-28 08:48:31 +00:00
meeb	33b471175a	Merge pull request #425 from locke4/main Add support for regex video title filtering	2023-11-20 16:53:58 +11:00
meeb	7f4e8586b7	Merge pull request #435 from klinker41/patch-1 Update other-database-backends.md	2023-11-20 16:51:00 +11:00
Jake Klinker	bab4b9b056	Update other-database-backends.md Add documentation about how to use a docker compose postgres container and connect it to tubesync. This seems like a fairly basic use case that many users would want to implement, given the large performance benefits it brings.	2023-11-19 10:23:07 -07:00
meeb	30c2127271	bump ffmpeg to 2023-11-14 and yt-dlp to 2023.11.16	2023-11-16 18:54:57 +11:00
locke4	d1cb7ef76c	Delete tubesync/sync/migrations/0020_auto_20231024_1812.py	2023-10-24 19:26:50 +01:00
locke4	1fd4f87c53	Merge pull request #8 from locke4/fix-pagenums Ran makemigrations	2023-10-24 19:25:52 +01:00
locke4	cf06f4cbc2	Merge pull request #7 from locke4/locke4-patch-2 Updated according to comments on PR	2023-10-24 18:38:17 +01:00
locke4	0523f481d2	Updated according to comments on PR Fixed whitespace Update tests.py Ran makemigrations Update models.py Update tests.py Update models.py Update tests.py Update models.py Update models.py Update tests.py Update models.py Update tests.py Update tests.py Update tests.py Update models.py Update models.py Update tests.py Update models.py Update models.py Update tests.py Update tests.py Update signals.py Update tasks.py Update signals.py Update models.py Update tasks.py Update signals.py Update tasks.py Update models.py	2023-10-24 18:37:09 +01:00
locke4	aa4bd4ec26	Ran makemigrations	2023-10-24 18:17:56 +01:00
locke4	96d9ee93ef	Merge pull request #6 from locke4/fix-pagenums Fix pagenums for "only_skipped" query param	2023-10-22 13:39:11 +01:00
sparklesmcfadden	43cf532903	Adds option to delete files on disk when removing a media item from TubeSync	2023-10-21 20:54:21 -05:00
locke4	8240c49d5c	Update ci.yaml	2023-10-22 02:42:57 +01:00
locke4	0c5e3d3818	Update media.html	2023-10-22 02:30:24 +01:00
locke4	22edd1bbda	Update pagination.html	2023-10-22 02:25:19 +01:00
locke4	fea0bb191e	Fix typo	2023-10-21 21:23:57 +01:00
locke4	0f65a4027a	Add support for regex filters on video names Update views.py Update tests.py Update source.html Update tasks.py Update signals.py Update 0001_initial.py Update models.py Update models.py Update tests.py	2023-10-21 21:07:15 +01:00
meeb	5cac374486	Merge pull request #420 from sparklesmcfadden/delete-removed-media Adds workflow to delete local media that no longer exists in the source	2023-10-21 14:31:39 +11:00
meeb	69efc9298d	Merge pull request #423 from ltomes/patch-1 Update other-database-backends.md	2023-10-21 14:30:06 +11:00
Levi Tomes	1be8dff769	Update other-database-backends.md django-admin only ran the loaddata for me with the - before the format flag.	2023-10-20 18:22:40 -05:00
cavanfarrell	350e544594	Fixes formatting	2023-10-20 10:25:20 -05:00
cavanfarrell	0542c734e5	Adds workflow to delete local media that no longer exists in the source	2023-10-20 10:19:57 -05:00
meeb	42b337c408	bump ffmpeg to autobuild-2023-10-11-14-20	2023-10-12 15:50:38 +11:00
meeb	2f82f8c599	fix tests	2023-10-12 15:44:51 +11:00
meeb	b57ca110b0	bump to 0.13.1	2023-10-12 15:34:33 +11:00
meeb	e3e7352600	add uploader variable, resolves #270	2023-10-12 15:33:58 +11:00
meeb	6d3a7bf859	move metadata collection to a higher priority over thumbnails, resolves #418	2023-10-12 15:27:19 +11:00