Impossible d'ajouter des articles

Désolé, nous ne sommes pas en mesure d'ajouter l'article car votre panier est déjà plein.

Veuillez réessayer plus tard

Échec de l’élimination de la liste d'envies.

Veuillez réessayer plus tard

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

LlamaCast

De : Shahriar Shariati

Écouter gratuitement

Résumé
Daily podcast about the published articles in the LLM field.

Shahriar Shariati

Afficher plus Afficher moins

Afficher plus Afficher moins

Les membres Amazon Prime bénéficient automatiquement de 2 livres audio offerts chez Audible.

Vous êtes membre Amazon Prime ?

Bénéficiez automatiquement de 2 livres audio offerts.
Bonne écoute !

Épisodes Voir plus

Marco-o1

Nov 23 2024

🤖 Marco-o1: Towards Open Reasoning Models for Open-Ended Solutions

The Alibaba MarcoPolo team presents Marco-o1, a large reasoning model designed to excel in open-ended problem-solving. Building upon OpenAI's o1 model, Marco-o1 incorporates Chain-of-Thought fine-tuning, Monte Carlo Tree Search, and innovative reasoning strategies to improve accuracy on complex tasks. The model is trained on a combination of existing and synthetic datasets and shows improvements in accuracy on benchmark datasets, particularly in handling nuanced language translation. Further research focuses on refining the reward system within the Monte Carlo Tree Search and using reinforcement learning to enhance its capabilities. The paper details the model's architecture, training process, and experimental results, highlighting its advancements in open-ended reasoning.

📎 Link to paper

Afficher plus Afficher moins

15 min

Impossible d'ajouter des articles

Désolé, nous ne sommes pas en mesure d'ajouter l'article car votre panier est déjà plein.

Veuillez réessayer plus tard

Veuillez réessayer plus tard

Échec de l’élimination de la liste d'envies.

Veuillez réessayer plus tard

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

Écouter gratuitement
Scaling Laws for Precision

Nov 18 2024

⚖️ Scaling Laws for Precision

This research paper investigates the impact of precision in training and inference on the performance of large language models. The authors explore how precision affects the effective parameter count and propose scaling laws that predict performance degradation due to low-precision training and post-training quantization. They find that overtrained models are more sensitive to post-training quantization, and that training larger models in lower precision might be computationally optimal. Their unified scaling law accounts for both training and post-training effects and predicts loss in varied precision settings, ultimately suggesting that the standard practice of training models in 16-bit might be suboptimal.

📎 Link to paper
🌐 Read their Tweet

Afficher plus Afficher moins

19 min

Impossible d'ajouter des articles

Désolé, nous ne sommes pas en mesure d'ajouter l'article car votre panier est déjà plein.

Veuillez réessayer plus tard

Veuillez réessayer plus tard

Échec de l’élimination de la liste d'envies.

Veuillez réessayer plus tard

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

Écouter gratuitement
Test-Time Training

Nov 14 2024

⌛️ The Surprising Effectiveness of Test-Time Training for Abstract Reasoning

This paper examines how test-time training (TTT) can enhance the abstract reasoning abilities of large language models (LLMs). TTT, which updates model parameters during inference, significantly improves performance on the Abstraction and Reasoning Corpus (ARC) benchmark. Key factors for effective TTT include initial fine-tuning, auxiliary tasks, and instance-specific training. The approach achieves state-of-the-art results on ARC, even matching human averages with program synthesis. This study suggests that dedicating computation at test time, rather than relying on symbolic components, may be essential for complex reasoning tasks.

📎 Link to paper

Afficher plus Afficher moins

15 min

Impossible d'ajouter des articles

Désolé, nous ne sommes pas en mesure d'ajouter l'article car votre panier est déjà plein.

Veuillez réessayer plus tard

Veuillez réessayer plus tard

Échec de l’élimination de la liste d'envies.

Veuillez réessayer plus tard

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

Écouter gratuitement

Ce que les auditeurs disent de LlamaCast

Moyenne des évaluations utilisateurs. Seuls les utilisateurs ayant écouté le titre peuvent laisser une évaluation.

Commentaires - Veuillez sélectionner les onglets ci-dessous pour changer la provenance des commentaires.

Commentaires Audible.fr

Commentaires Amazon

Il n'y a pas encore de critique disponible pour ce titre.

Signaler un commentaire sur Amazon

Catégories (A-Z)

À découvrir

Les services Audible

GRATUIT POUR LES ABONNÉS

LlamaCast

Impossible d'ajouter des articles

Échec de l’élimination de la liste d'envies.

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

LlamaCast

Résumé

Vous êtes membre Amazon Prime ?

Marco-o1

Impossible d'ajouter des articles

Échec de l’élimination de la liste d'envies.

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

Scaling Laws for Precision

Impossible d'ajouter des articles

Échec de l’élimination de la liste d'envies.

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

Test-Time Training

Impossible d'ajouter des articles

Échec de l’élimination de la liste d'envies.

Impossible de suivre le podcast

Impossible de ne plus suivre le podcast

Ce que les auditeurs disent de LlamaCast

Commentaires - Veuillez sélectionner les onglets ci-dessous pour changer la provenance des commentaires.

Commentaires Audible.fr

Commentaires Amazon