Towards Comprehensive Cluster-induced Methods for Recommender Systems

  • Recommender systems recommend items (e.g., movies, products, books) to users. In this thesis, we proposed two comprehensive and cluster-induced recommendation-based methods: Orthogonal Inductive Matrix Completion (OMIC) and Burst-induced Multi-armed Bandit (BMAB). Given the presence of side information, the first method is categorized as context-aware. OMIC is the first matrix completion method to approach the problem of incorporating biases, side information terms and a pure low-rank term into a single flexible framework with a well-principled optimization procedure. The second method, BMAB, is context-free. That is, it does not require any side data about users or items. Unlike previous context-free multi-armed bandit approaches, our method considers the temporal dynamics of human communication on the web and treats the problem in a continuous time setting. We built our models' assumptions under solid theoretical foundations. For OMIC, we provided theoretical guarantees in the form of generalization bounds by considering the distribution-free case: no assumptions about the sampling distribution are made. Additionally, we conducted a theoretical analysis of community side information when the sampling distribution is known and an adjusted nuclear norm regularization is applied. We showed that our method requires just a few entries to accurately recover the ratings matrix if the structure of the ground truth closely matches the cluster side information. For BMAB, we provided regret guarantees under mild conditions that demonstrate how the system's stability affects the expected reward. Furthermore, we conducted extensive experiments to validate our proposed methodologies. In a controlled environment, we implemented synthetic data generation techniques capable of replicating the domains for which OMIC and BMAB were designed. As a result, we were able to analyze our algorithms' performance across a broad spectrum of ground truth regimes. Finally, we replicated a real-world scenario by utilizing well-established recommender datasets. After comparing our approaches to several baselines, we observe that they achieved state-of-the-art results in terms of accuracy. Apart from being highly accurate, these methods improve interpretability by describing and quantifying features of the datasets they characterize.
  • Empfehlungssysteme empfehlen den Benutzern Artikel (z.B. Filme, Produkte, Bücher). In dieser Arbeit stellen wir zwei umfangreiche und cluster-induzierte empfehlungsbasierte Methoden vor: Orthogonal Inductive Matrix Completion (OMIC) und (Burst-induced Multi-armed Bandit). Angesichts der vorhandenen Nebeninformationen wird die erste Methode als kontextbewusst eingestuft. OMIC ist die erste Methode zur Matrixvervollständigung, die das Problem der Einbeziehung von Verzerrungen, Nebeninformationen und einem rein niederrangigen Term in einem einzigem flexiblen Framework mit einem fundierten Optimierungsverfahren angeht. Die zweite Methodik, BMAB, ist kontextfrei. Das bedeutet, dass sie keine Nebendaten über Nutzer oder Artikel benötigt.Im Gegensatz zu vorherigen kontextfreien Ansätzen mit Multi-armed Bandits, berücksichtigt unsere Methode die temporale Dynamik menschlicher Kommunikation im Internet und behandelt das Problem in einem kontinuierlichen Zeitrahmen.Wir haben die Annahmen unserer Modelle auf eine solide theoretische Grundlage gestellt. Indem wir den verteilungsfreien Fall betrachtet haben, haben wir für OMIC theoretische Garantien in Form von Generalisierungsschranken aufgestellt. Für den Fall in dem die Datenverteilung bekannt ist und eine angepasste Kernnormregularisierung angewendet wird, haben wir darüber hinaus eine theoretische Analyse der Gemeinschaftsseiteninformationen durchgeführt. Wir haben gezeigt, dass unsere Methode nur wenige Matrixeinträge benötigt, um die Bewertungsmatrix genau wiederherzustellen, wenn die Struktur der Grundwahrheit (ground truth) nahezu mit der Seiteninformation des Clusters übereinstimmt. Für BMAB haben wir unter milden Bedingungen Rückgewinnungsgarantien entwickelt, die zeigen, wie die Stabilität des Systems die erwartete Belohnung beeinflusst. Des Weiteren haben wir umfangreiche Experimente durchgeführt, um unsere vorgestellten Methoden zu validieren. In einer kontrollierten Umgebung haben wir Techniken zur Erzeugung synthetischer Daten implementiert, die in der Lage sind, die Domänen zu replizieren, für die OMIC und BMAB entwickelt wurden. Nach dem Vergleich unserer Ansätze mit verschiedenen Basisverfahren stellen wir fest, dass sie in Bezug auf Genauigkeit die besten Ergebnisse erzielen und einen neuen Stand der Technik darstellen. Abgesehen von ihrer hohen Genauigkeit verbessern diese Methoden die Interpretierbarkeit durch eine Beschreibung und Quantifizierung von Merkmalen der charakterisierten Datensätze.

Download full text files

Export metadata

Metadaten
Author:Rodrigo Augusto da Silva Alves
URN:urn:nbn:de:hbz:386-kluedo-67342
DOI:https://doi.org/10.26204/KLUEDO/6734
Advisor:Marius Kloft
Document Type:Doctoral Thesis
Language of publication:English
Date of Publication (online):2022/02/03
Year of first Publication:2022
Publishing Institution:Technische Universität Kaiserslautern
Granting Institution:Technische Universität Kaiserslautern
Acceptance Date of the Thesis:2022/02/01
Date of the Publication (Server):2022/02/04
Tag:Machine Learning; Matrix Completion; Recommender Systems; Reinforcement Learning
Page Number:XIII, 139
Faculties / Organisational entities:Kaiserslautern - Fachbereich Informatik
CCS-Classification (computer science):G. Mathematics of Computing
I. Computing Methodologies
J. Computer Applications
DDC-Cassification:0 Allgemeines, Informatik, Informationswissenschaft / 004 Informatik
Licence (German):Creative Commons 4.0 - Namensnennung, nicht kommerziell, keine Bearbeitung (CC BY-NC-ND 4.0)